SlideShare una empresa de Scribd logo
1 de 12
Descargar para leer sin conexión
SNATWITTER LIST
ipotesi di analisi	

!
by: C. Di Tullio aka Dr_Who
drwho.it
“La scienza si fa con i fatti come una casa si fa con i
mattoni, ma l’accumulazione dei fatti non è scienza più di
quanto un mucchio di mattoni non sia una casa” Henri Poincarè
Step1:	

scarico la lista di 84 persone daTwitter. Lista nella
quale ci sono anche io
Step2:	

la depuro da me: eliminando i miei dati dal foglio vertex e tutti
i collegamenti a me relativi dal foglio edges
Step3:	

domanda: come identificare le persone più influenti da contattare?	

calcolo le metriche
Step3:	

come primo valore considero l’Eigenvector: misura l’importanza e
l’influenza di un nodo all’interno della rete in cui si relaziona.	

valore medio 0,014
In autofill columns
imposto la vertex
size con i valori della
eigenvector come
massimo 42 (0,42) e
come minimo il
valore della media 14
(0,014)
Step4:	

per renderla leggibile la divido in cluster. 4 i cluster identificati
Group, group by
cluster, ok	

!
Layout, option,
outlines
Step5:	

il solo valore di eigenvector non è particolarmente discriminante, a
questo punto considero gli in-degree: un valore alto significa che il
nodo è popolare.
La media è pari a 10;
il valore massimo è
pari a 24. Con i filtri
dinamici setto questi
due valori 	

da cui individuo i nodi
strategici
Step5:	

il solo valore di eigenvector non è particolarmente discriminante, a
questo punto considero gli in-degree: un valore alto significa che il
nodo è popolare.
La media è pari a 10;
il valore massimo è
pari a 24. Con i filtri
dinamici setto questi
due valori 	

da cui individuo i nodi
strategici
Step6:	

in-degree non è ancora sufficiente: non mi discrimina il cluster azzurro.	

Per farlo osservo la betweenness: quanto spesso un vertice si pone nel
percorso più breve.
la medi è pari a 67, il
massimo è 1285.
imposto il tutto con i
filtri dinamici. …	

!
Step6:	

in-degree non è ancora sufficiente: non mi discrimina il cluster azzurro.	

Per farlo osservo la betweenness: quanto spesso un vertice si pone nel
percorso più breve.
la medi è pari a 67, il
massimo è 1285.
imposto il tutto con i
filtri dinamici.	

!
nel lavorare il filtro mi
sono fermato a 48
come valore per non
perdere la visibilità
del vertice C e del
vertice N	

!
Step7:	

con 18 persone stimolate, questa dovrebbe essere la copertura della lista

Más contenido relacionado

Destacado

TEDxPompeii Social Networking Analysis
TEDxPompeii Social Networking AnalysisTEDxPompeii Social Networking Analysis
TEDxPompeii Social Networking AnalysisCamillo Di Tullio
 
Marketing non convenzionale: approccio
Marketing non convenzionale: approccioMarketing non convenzionale: approccio
Marketing non convenzionale: approccioCamillo Di Tullio
 
Text mining analysis: ipotesi operativa
Text mining analysis: ipotesi operativaText mining analysis: ipotesi operativa
Text mining analysis: ipotesi operativaCamillo Di Tullio
 
#BereBasilicata al Vinitaly 2016
#BereBasilicata al Vinitaly 2016#BereBasilicata al Vinitaly 2016
#BereBasilicata al Vinitaly 2016Camillo Di Tullio
 
Web Marketing Festival 2016 visto con gli occhi dei BigData
Web Marketing Festival 2016 visto con gli occhi dei BigDataWeb Marketing Festival 2016 visto con gli occhi dei BigData
Web Marketing Festival 2016 visto con gli occhi dei BigDataCamillo Di Tullio
 
#FoodPorn Community Detection
#FoodPorn Community Detection#FoodPorn Community Detection
#FoodPorn Community DetectionCamillo Di Tullio
 
TEDxVicenza_2016_Social_Networking_Analysis
TEDxVicenza_2016_Social_Networking_AnalysisTEDxVicenza_2016_Social_Networking_Analysis
TEDxVicenza_2016_Social_Networking_AnalysisCamillo Di Tullio
 
24hrs Camp Per Rome Camp 2008
24hrs Camp  Per Rome Camp 200824hrs Camp  Per Rome Camp 2008
24hrs Camp Per Rome Camp 2008Camillo Di Tullio
 
How can Big data accelerate CDN services ?
How can Big data accelerate CDN services ?How can Big data accelerate CDN services ?
How can Big data accelerate CDN services ?ANOOP KUMAR P
 
Ways of Seeing Data: Towards a Critical Literacy for Data Visualisations as R...
Ways of Seeing Data: Towards a Critical Literacy for Data Visualisations as R...Ways of Seeing Data: Towards a Critical Literacy for Data Visualisations as R...
Ways of Seeing Data: Towards a Critical Literacy for Data Visualisations as R...Jonathan Gray
 
Engineering the Future: The Socio-Economic Case for Gender Equality
Engineering the Future: The Socio-Economic Case for Gender EqualityEngineering the Future: The Socio-Economic Case for Gender Equality
Engineering the Future: The Socio-Economic Case for Gender EqualityGE
 
Visualising Data with Code
Visualising Data with CodeVisualising Data with Code
Visualising Data with CodeRi Liu
 
Booz Allen Field Guide to Data Science
Booz Allen Field Guide to Data Science Booz Allen Field Guide to Data Science
Booz Allen Field Guide to Data Science Booz Allen Hamilton
 

Destacado (16)

Brainstorming
BrainstormingBrainstorming
Brainstorming
 
TEDxPompeii Social Networking Analysis
TEDxPompeii Social Networking AnalysisTEDxPompeii Social Networking Analysis
TEDxPompeii Social Networking Analysis
 
Marketing non convenzionale: approccio
Marketing non convenzionale: approccioMarketing non convenzionale: approccio
Marketing non convenzionale: approccio
 
Text mining analysis: ipotesi operativa
Text mining analysis: ipotesi operativaText mining analysis: ipotesi operativa
Text mining analysis: ipotesi operativa
 
#BereBasilicata al Vinitaly 2016
#BereBasilicata al Vinitaly 2016#BereBasilicata al Vinitaly 2016
#BereBasilicata al Vinitaly 2016
 
Essere brand
Essere brandEssere brand
Essere brand
 
Web Marketing Festival 2016 visto con gli occhi dei BigData
Web Marketing Festival 2016 visto con gli occhi dei BigDataWeb Marketing Festival 2016 visto con gli occhi dei BigData
Web Marketing Festival 2016 visto con gli occhi dei BigData
 
#FoodPorn Community Detection
#FoodPorn Community Detection#FoodPorn Community Detection
#FoodPorn Community Detection
 
TEDxVicenza_2016_Social_Networking_Analysis
TEDxVicenza_2016_Social_Networking_AnalysisTEDxVicenza_2016_Social_Networking_Analysis
TEDxVicenza_2016_Social_Networking_Analysis
 
Dr_Who's Words
Dr_Who's WordsDr_Who's Words
Dr_Who's Words
 
24hrs Camp Per Rome Camp 2008
24hrs Camp  Per Rome Camp 200824hrs Camp  Per Rome Camp 2008
24hrs Camp Per Rome Camp 2008
 
How can Big data accelerate CDN services ?
How can Big data accelerate CDN services ?How can Big data accelerate CDN services ?
How can Big data accelerate CDN services ?
 
Ways of Seeing Data: Towards a Critical Literacy for Data Visualisations as R...
Ways of Seeing Data: Towards a Critical Literacy for Data Visualisations as R...Ways of Seeing Data: Towards a Critical Literacy for Data Visualisations as R...
Ways of Seeing Data: Towards a Critical Literacy for Data Visualisations as R...
 
Engineering the Future: The Socio-Economic Case for Gender Equality
Engineering the Future: The Socio-Economic Case for Gender EqualityEngineering the Future: The Socio-Economic Case for Gender Equality
Engineering the Future: The Socio-Economic Case for Gender Equality
 
Visualising Data with Code
Visualising Data with CodeVisualising Data with Code
Visualising Data with Code
 
Booz Allen Field Guide to Data Science
Booz Allen Field Guide to Data Science Booz Allen Field Guide to Data Science
Booz Allen Field Guide to Data Science
 

Ipotesi di analisi lista twitter

  • 1. SNATWITTER LIST ipotesi di analisi ! by: C. Di Tullio aka Dr_Who drwho.it
  • 2. “La scienza si fa con i fatti come una casa si fa con i mattoni, ma l’accumulazione dei fatti non è scienza più di quanto un mucchio di mattoni non sia una casa” Henri Poincarè
  • 3. Step1: scarico la lista di 84 persone daTwitter. Lista nella quale ci sono anche io
  • 4. Step2: la depuro da me: eliminando i miei dati dal foglio vertex e tutti i collegamenti a me relativi dal foglio edges
  • 5. Step3: domanda: come identificare le persone più influenti da contattare? calcolo le metriche
  • 6. Step3: come primo valore considero l’Eigenvector: misura l’importanza e l’influenza di un nodo all’interno della rete in cui si relaziona. valore medio 0,014 In autofill columns imposto la vertex size con i valori della eigenvector come massimo 42 (0,42) e come minimo il valore della media 14 (0,014)
  • 7. Step4: per renderla leggibile la divido in cluster. 4 i cluster identificati Group, group by cluster, ok ! Layout, option, outlines
  • 8. Step5: il solo valore di eigenvector non è particolarmente discriminante, a questo punto considero gli in-degree: un valore alto significa che il nodo è popolare. La media è pari a 10; il valore massimo è pari a 24. Con i filtri dinamici setto questi due valori da cui individuo i nodi strategici
  • 9. Step5: il solo valore di eigenvector non è particolarmente discriminante, a questo punto considero gli in-degree: un valore alto significa che il nodo è popolare. La media è pari a 10; il valore massimo è pari a 24. Con i filtri dinamici setto questi due valori da cui individuo i nodi strategici
  • 10. Step6: in-degree non è ancora sufficiente: non mi discrimina il cluster azzurro. Per farlo osservo la betweenness: quanto spesso un vertice si pone nel percorso più breve. la medi è pari a 67, il massimo è 1285. imposto il tutto con i filtri dinamici. … !
  • 11. Step6: in-degree non è ancora sufficiente: non mi discrimina il cluster azzurro. Per farlo osservo la betweenness: quanto spesso un vertice si pone nel percorso più breve. la medi è pari a 67, il massimo è 1285. imposto il tutto con i filtri dinamici. ! nel lavorare il filtro mi sono fermato a 48 come valore per non perdere la visibilità del vertice C e del vertice N !
  • 12. Step7: con 18 persone stimolate, questa dovrebbe essere la copertura della lista