Tim Berners-Lee on the next Web (2009)

Tim Berners-Lee, dati nudi e crudi ora! - video talks




Il tempo vola È stato quasi 20 anni fa che ho deciso di ripensare il modo in cui usiamo le informazioni. il modo in cui lavoriamo insieme -- ho inventato il World Wide Web. Ora, vent'anni dopo, a TED, Voglio chiedere il vostro aiuto per un nuovo cambio di prospettiva.

Dunque, tornando al 1989, Scrissi un memorandum in cui proponevo il sistema ipertestuale globale. Nessuno ci fece molto caso al momento. Ma 18 mesi dopo -- così succede con le innovazioni -- 18 mesi dopo, il mio capo disse che potevo occuparmi di quel progetto ma come progetto secondario, per rodare un nuovo computer che avevamo preso. E mi diede il tempo di scrivere il programma. Così buttai giù una bozza di come doveva essere l'HTML, il protocollo ipertestuale -- HTTP -- l'idea degli URL -- questi nomi per le cose -- che iniziavano con HTTP. Scrissi il programma e misi il codice a disposizione di tutti.

Perché l'ho fatto? Beh, è stata fondamentalmente frustrazione. Ero frustrato -- lavoravo come software engineer in questo laboratorio enorme, davvero stimolante pieno di persone che arrivavano da ogni parte del mondo. Che lavoravano con ogni sorta di computer, diversi tra loro Che utilizzavano ogni sorta di formato per i dati Ogni sorta, ogni tipo di sistema di documentazione. Perciò, con tutte queste differenze, se volevo trovare il modo di fare qualcosa prendendo una cosa da una parte e una cosa dall'altra, qualsiasi cosa volessi approfondire, dovevo connettermi a una nuova macchina, imparare a far funzionare un nuovo programma, e alla fine trovavo le informazioni che volevo in qualche nuovo formato di dati. Ed erano tutti incompatibili tra loro. Era davvero molto frustrante. La frustrazione era tutto questo potenziale inesplorato.

In effetti, su tutti i dischi c'erano documenti. Quindi se riuscivi a immaginarli come parte di un grande, sistema virtuale di documentazione da qualche parte, magari su Internet, la vita sarebbe stata più semplice per tutti. Beh, quando ti viene un'idea simile, è qualcosa che ti entra sotto pelle e anche se la gente non legge i tuoi memorandum -- in realtà il mio capo lo lesse, dopo la sua morte, la sua copia fu trovata. Aveva scritto, "Vago, ma eccitante" a matita, in un angolino.

(Risata)

Ma in generale, era difficile -- molto difficile spiegare come sarebbe stato il Web. Ed è difficile far capire oggi alla gente quanto era difficile spiegarlo. Ma .. -- OK, quando è nato TED, il web non esisteva quindi cose tipo "cliccare" non avevano lo stesso significato. Potevo far vedere a qualcuno un brano di ipertesto, una pagina con dei link, clicchiamo sul link e bing, ecco che appare una nuova pagina di ipertesto. Niente di speciale. Lo avevamo già visto -- avevamo documenti ipertestuali su CD-ROM. La cosa difficile era far arrivare gli altri a immaginare Quindi, immaginate che quel link avrebbe potuto farvi arrivare praticamente a qualunque documento immaginabile. Ok, questo è lo scarto che per i più era veramente difficile da fare. Beh, qualcuno ci riusciva. Ed anche se era difficile da spiegare, si creò comunque un movimento spontaneo dal basso. E questo fu ciò che lo rese più divertente. Questa è stata la cosa più eccitante, non la tecnologia, non cosa le persone ne hanno fatto, ma la comunità, lo spirito di tutte queste persone che si riunivano, si scambiavano email. Ecco com'erano le cose allora.

E sapete una cosa? E' strano, ma in questo momento, le cose stanno tornando ad essere di nuovo come allora. Ho chiesto più o meno a tutti, di mettere a disposizione i propri documenti -- Ho detto, "Potreste caricare i vostri documenti su questa cosa, sul web?" E, lo avete fatto. Grazie. È stato spettacoloso, vero? Voglio dire, è stata una cosa molto interessante perché abbiamo scoperto che le cose che vengono fuori dal Web in qualche modo ci spiazzano. Vanno ben oltre quello che immaginavamo all'inizio quando abbiamo messo insieme il sito web dal quale siamo partiti. Ora, voglio che voi carichiate i vostri dati sul web. Vedrete che c'è ancora un enorme potenziale inesplorato. C'è ancora un'enorme frustrazione perché i dati al momento non sono sul web in forma di dati.

Che vuol dire dati? Dati, documenti -- che differenza c'è? I documenti li leggiamo, OK? Più o meno, i documenti si leggono, si possono seguire i link tra uno e l'altro ed è tutto. Con i dati -- puoi fare un sacco di cose se hai un computer. Chi di voi era presente o ha comunque visto il talk di Hans Rosling? Uno dei più belli -- si molti di voi l'hanno visto -- uno dei migliori TED Talks. Hans ha fatto vedere una presentazione in cui mostrava, per vari paesi e in colori differenti -- i livelli di reddito su un asse e i livelli della mortalità infantile, animando il tutto su una scala temporale. Dunque, Hans ha preso questi dati e ha fatto una presentazione che ha infranto molti dei miti che la gente ha sull'economia dei paesi in via di sviluppo.

Ha fatto vedere una slide simile a questa. Ad essa sottostavano tutta una serie di dati OK, i dati sono noiose scatole marroni, ed è così che ce li immaginiamo, no? Perchè i dati di per sé non sono di immediata applicazione Ma in realtà, i dati determinano tantissime cose nelle nostre vite e ciò accade perchè c'è qualcuno che prende quei dati e ne fa qualcosa. In questo caso, Hans aveva messo insieme i dati che aveva raccolto da ogni sorta di sito delle Nazioni Unite. Lui aveva raccolto i dati, li aveva combinati in una cosa più interessante delle singole parti e li aveva poi inseriti in un software, che credo abbia sviluppato suo figlio, originariamente, e ha fatto questa presentazione meravigliosa. E Hans ha insistito nel dire, "Guardate, è davvero importante avere molti dati." E io sono stato felice di vedere che al rinfresco l'altra sera lui lo ripeteva, con enfasi, "E' davvero importante avere molti dati."

Quindi voglio che ora noi tutti pensiamo non a due semplici tipologie di dati messi in relazione, o a sei, come ha fatto lui, ma voglio pensare a un mondo in cui tutti abbiano caricato dati sul web e dunque praticamente qualunque cosa possiate immaginare sia sul web. e chiamare il tutto dati linkati. La tecnologia è quella dei dati linkati, ed è estremamente semplice. Se volete mettere qualcosa sul web, ci sono tre regole la prima cosa sono quei nomi HTTP -- quelle cose che iniziano con http: -- ora non li useremo più solo per i documenti, ma li useremo per indicare anche cose di cui parlano i documenti. Li useremo per le persone, li useremo per i luoghi, li useremo per i vostri prodotti, li useremo per gli eventi. Ogni sorta di concetto, ha ora un nome che inizia con HTTP.

Seconda regola, se prendo uno di questi nomi HTTP e lo cerco e vado sul web, e recupero i dati corrispondenti usando il protocollo HTTP dal web, ne ricaverò dei dati in un formato standard che potrebbero essere dati utili, che potrebbero interessare a qualcuno a proposito di questo o di quell'altro evento. Chi c'era a quell'evento? Qualunque cosa riguardi una di quelle persone, dove è nata, o cose simili. Quindi la seconda regola è che posso ricavare informazioni importanti.

La terza è che quando ricavo tali informazioni non avrò solo l'altezza, il peso o la data di nascita di qualcuno, ma otterrò relazioni. I dati sono relazioni. È interessante, i dati sono relazioni. La tal persona è nata a Berlino, Berlino è in Germania. E quando ci sono delle relazioni, ogni volta che c'è una relazione l'altro dato a cui è relazionato riceve anch'esso uno di quei nomi che iniziano con HTTP. Quindi posso continuare e consultare questo nuovo dato. Così [se] cerco una persona -- posso vedere la città in cui è nata posso vedere la regione in cui si trova, in che città, quale sia la popolazione di questa città, e così via. Così posso scorrere tutte queste informazioni.

È tutto qui, davvero. Questi sono i dati linkati. Ho scritto un articolo intitolato "Dati Linkati" un paio di anni fa e poco dopo, hanno cominciato a succedere un po' di cose. L'idea dei dati linkati è che si possano avere molte, moltissime di queste scatole che ha utilizzato Hans, e dunque molte, moltissime altre cose che ne germogliano. E non si tratta solo di una popolazione di nuove piante. Non è solo una radice che nutre una pianta, ma per ognuna di quelle piante, di qualunque tipo essa sia -- una presentazione, un'analisi, qualcuno che cerchi dei pattern nei dati -- [chi la fa] guarda tutti i dati e li connette tra loro, E la cosa davvero importante dei dati è che più cose devi connettere le une alle altre, più i dati diventano potenti.

Quindi, dati linkati. Il meme si è diffuso là fuori. E, abbastanza presto, Chris Bizer alla Freie Universitat di Berlino che è stato uno dei primi a mettere insieme qualcosa d'interessante, ha notato che Wikipedia -- sapete, Wikipedia, l'enciclopedia online che contiene un sacco di documenti interessanti. Ebbene, in quei documenti, ci sono delle piccole scatole, dei piccoli riquadri. E nella maggior parte di quei riquadri informativi, ci sono dei dati. Così lui ha scritto un programma che estrapola quei dati da Wikipedia, E li mette in un insieme di dati linkati sul web, che ha chiamato Dbpedia. Dbpedia è rappresentata dall'insieme blu nel mezzo di questa slide e se voi andate a cercare "Berlino", scoprirete che vi sono altri insiemi di dati i quali a loro volta contengono informazioni su Berlino, e sono interconnessi. Così se recuperate alcuni dati di Dbpedia su Berlino, finirete per recuperare anche tutte queste altre informazioni. E ciò che è eccitante è che la cosa sta iniziando a crescere: è di nuovo l'inizio di un movimento spontaneo, dal basso.

Fermiamoci a riflettere sui dati per un attimo. I dati si presentano in un sacco di forme differenti Riflettete sulla varietà del web, è una cosa davvero importante: il web vi permette di caricare qualunque tipo di informazione. Così succede con i dati. Potrei riferirmi a qualunque tipo di dati. Pensiamo ai dati governativi, anche i dati delle aziende sono molto importanti, ci sono dati scientifici, dati personali, ci sono dati meteorologici, dati su eventi, ci sono dati sulle conferenze, sulla cronaca e su ogni tipo di cose. Nominerò solo di alcuni di questi per darvi un'idea della varietà, perchè anche voi possiate vedere quale sia il potenziale dietro tutto questo.

Iniziamo coi dati governativi. Barack Obama, in un discorso, ha dichiarato, che i dati del governo americano sarebbero stati resi disponibili su Internet in formati accessibili. E io spero proprio che li rendano disponibili come dati linkati. Questo è importante. Perchè è importante? Non solo per questioni di trasparenza, certo, la trasparenza dei governi è importante, ma quei dati -- sono i dati di tutti i dipartimenti del governo Pensate a quanti di quei dati sono legati a come si vive in America. Sono veramente utili. Hanno valore. Posso utilizzarli nella mia azienda. Se fossi un ragazzino, potrei utilizzarli per i miei compiti a casa. Stiamo parlando di come far girare meglio il mondo rendendo accessibili questi dati.

Di fatto se voi stessi siete responsabili -- se siete a conoscenza di dati in un particolare dipartimento governativo, spesso scoprite che queste persone, sono molto tentate di tenerseli -- Hans lo chiama "Tenersi stretto il database". Ci si tiene stretto il proprio database, non lo si lascia andare finchè non è stato fatto un bel sito web per l'accesso. Beh, io vorrei suggerire invece -- si, fate un bel sito web, chi sono io per dirvi di non fare un bel sito web? Fate un bel sito, ma prima dateci i dati non adulterati, vogliamo i dati. Vogliamo dati non adulterati. Ok, dobbiamo richiedere i dati nudi e crudi adesso. E io vi chiederò di allenarvi a chiederli, OK? Dite "nudi e crudi."

Audience: Nudi e crudi

Tim Berners-Lee: Potete dire "dati"?

Audience: Dati.

TBL: Potete dire "ora"?

L'audience: "Ora!"

TBL: Bene, dati nudi e crudi ora!

L'audience: Dati nudi e crudi ora!

Ripetetelo: è importante perchè non avete idea della quantità di scuse che la gente si inventa per tenersi stretti i propri dati e non darveli, anche se li avete già pagati con le vostre tasse. E non è solo in America. È così in tutto il mondo. E non sono solo i governi, certo -- [ma] anche le aziende.

Vi parlerò solo di un altro paio di riflessioni sui dati. Siamo qui al TED, e abbiamo ben presenti le grandi sfide che la società umana deve affrontare in questo momento -- curare il cancro, capire il funzionamento del cervello per [curare] l'Alzheimer, capire l'economia per renderla un pochino più stabile, capire come funziona il mondo. Le persone che risolveranno questi problemi -- gli scienziati -- hanno in mente idee sviluppate solo in parte, e cercano di comunicarsele attraverso il web. Ma molto del sapere umano in questo momento è nei database, che spesso risiedono nei loro computer, e in realtà, al momento, non è condiviso.

Per spiegarmi, approfondirò un tema -- se pensate al morbo di Alzheimer, per esempio, la scoperta dei medicinali -- c'è una gran quantità di dati linkati che stanno venendo a galla perché gli scenziati in quel campo si sono resi conto che è un buon modo per uscire da questi silos, perché hanno i loro dati sui genomi in un certo database in un certo palazzo, e hanno i dati sulle proteine in un altro E ora, li stanno appiccicando gli uni agli altri -- dati linkati -- e possono porre il tipo di domanda, che voi probabilmente non fareste, che io non la farei -- [ma] loro si. Quali proteine sono coinvolte nella trasduzione dei segnali e sono anche collegate ai neuroni piramidali? Beh, se prendete queste quattro parole e le inserite in Google Di certo non trovate una pagina che risponda a questa domanda perché nessuno ha mai fatto questa domanda. Ottenete 223000 risultati -- ma nessuno che sia di una qualche utilità. Se fate la stessa domanda ai dati linkati -- che ora loro hanno assemblato -- ottenete 32 risultati, ognuno delle quali è una proteina con quelle proprietà e che potete andare a vedere. Poter porre domande di questo genere, come scienziato -- domande che coinvolgono discipline differenti -- è un vero cambiamento con la C maiuscola. È molto, molto importante. Gli scienziati hanno le mani legate al momento -- la potenzialità dei dati che altri scienziati hanno raccolto è inaccessibile e noi dobbiamo rendere i dati accessibili per poter affrontare questi enormi problemi.

Ora, se continuo così, penserete che tutti i dati provengano da grosse istituzioni e non abbiano nulla a che fare con voi. Ma questo non è vero Infatti, i dati riguardano le nostre vite Quando fate log-in nel vostro sito di social networking, nel vostro preferito, e dite, "Questo è mio amico". Bing! Relazione. Dato. Dite, "questa fotografia ritrae questa persona." Bing! Quello è un dato. Dati, dati, dati. Ogni volta che fate qualcosa sul vostro social network, il sito sta ricavando dei dati e li sta usando -- li sta riutilizzando -- e li sta usando per rendere più interessanti le vite delle altre persone sul sito. Ma quando andate su un altro sito di dati linkati -- e diciamo che si tratta di un sito di viaggi, e dite: "Voglio inviare questa foto a tutte le persone di quel gruppo," non riuscite a superare i muri virtuali. L'Economist ne ha parlato in un articolo, e molte persone hanno scritto nei propri blog sull'argomento -- una frustrazione tremenda. Il modo per distruggere i silos è ottenere l'interoperabilità tra i siti di social networking. Dobbiamo farlo attraverso i dati linkati.

Parlerò di un ultimo tipo di dati, forse è il più eccitante. Prima di arrivare qui, ho fatto una ricerca su OpenStreetMap OpenStreetMap è una mappa, ma è anche una Wiki. Zoomate e quel quadrato è un teatro -- quello in cui ci troviamo ora -- Il Terrace Theater. Non aveva un nome sulla mappa. Così sono entrato in modalità di editing, ho selezionato il teatro, ho aggiunto il nome in basso, e l'ho salvato. E ora se tornate su OpenStreetMap.org e trovate questo posto, scoprirete che il Terrace Theater ha un nome. L'ho fatto proprio io! L'ho fatto sulla mappa. L'ho appena fatto! Ce l'ho messo io. Ehi, sapete una cosa? Se io -- quella mappa è tutta fatta di singoli contributi e crea una risorsa incredibile perché ognuno fa la propria parte. E i dati linkati consistono proprio in questo. Stiamo parlando di persone che fanno la propria parte per aggiungere una piccola porzione, e connettere il tutto. Così funzionano i dati linkati. Tu fai la tua parte. Tutti gli altri fanno la loro. Magari non avete non molti dati vostri da inserire ma sapete come chiederli. Abbiamo fatto pratica prima.

Quindi, dati linkati -- sono una cosa di enorme portata. Vi ho raccontato solo pochissime cose I dati sono in ogni aspetto della nostra esistenza, in ogni aspetto del lavoro e del tempo libero, e non stiamo parlando solo del numero di posti da cui arrivano i dati, stiamo parlando di connetterli gli uni agli altri. E quando connetti i dati, ottieni un potere in un modo che non succede semplicemente con il web, coi documenti. Fai venir fuori questa immensa potenzialità. Così, siamo arrivati al punto in cui è è necessario agire --- le persone che pensano sia una grande idea E tutte le persone -- e credo che ve ne siano molte al TED che agiscono per una ragione -- anche se non vi è un immediato ritorno sull'investimento perché il ritorno arriverà quando ognuno avrà fatto la propria parte -- ci saranno persone che lo faranno perchè sono il tipo di persone che fanno le cose che rendono se tutti le fanno. Ok, quindi si chiamano dati linkati. Voglio che voi li produciate. Voglio che voi li esigiate. E credo che sia un'idea che meriti di essere diffusa.

Grazie

(Applausi)

Commenti