Menu

Le coordinate dell'information design

Ngram Viewer, uno strumento stupefacente

maggio 12, 2014 - Big Data, Data Visualization
Ngram Viewer, uno strumento stupefacente

Ngram Viewer è uno strumento di Google poco conosciuto ma estremamente interessante.
Permette di cercare e contare le occorrenze di parole, espressioni e brevi frasi all’interno di un grande corpus letterario dal 1800 al 2008. Per corpus si intende una collezione di testi selezionati, organizzati e digitalizzati per facilitare le analisi linguistiche.

Una volta impostati i termini da ricercare, il periodo di riferimento, la lingua desiderata e il livello di accuratezza del grafico (0 è il massimo ma il 3 preimpostato ne rende più agevole la lettura), si può procedere con la ricerca e la conseguente creazione della line-chart.

Ecco un primo esempio con dei termini di intrattenimento tecnologico:

Già da questo grafico risulta evidente come ci sia sempre una reciproca influenza tra l’immaginario collettivo e i testi scritti.

Qui invece vediamo l’evoluzione delle citazioni sulle sostanze stupefacenti, dal monopolio dell’oppio al dilagare di eroina e cocaina, passando per il boom degli allucinogeni.

Altro grafico che abbiamo provato a fare è quello riguardante gli alcolici, con il monopolio del vino, la costante bourbon e l’andamento ondivago del gin.

Continuando a sondare il lessico degli aspetti che traviano la società italiana, abbiamo interrogato lo strumento sui diversi tipi di criminalità organizzata, ottenendo due picchi in corrispondenza di Mani pulite e Gomorra:

Per trovare maggiori istruzioni su come utilizzare Ngram viewer in modo avanzato e avere ulteriori informazioni sui corpora consultate questa pagina. Un esempio è l’uso della wildcard search con *, che qui abbiamo applicato al mondo accademico cercando “Università di *”

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *