Lo scorso 19 novembre sono stati presentati i risultati della ricerca IBM “Il lato fashion dei dati” realizzata dal team IBM Italia (del quale ho fatto parte) in collaborazione con Università Cattolica di Milano e MF Fashion. Ricerca che ha l’obiettivo di analizzare i trend economici e tecnologici associati al fashion e ai suoi brand.
Il percorso di indagine si è sviluppato con un insieme di interviste a un panel di oltre 40 esperti e blogger di riferimento, per far emergere i concetti-fenomeni di maggiore rilevanza rispetto agli ambiti esaminati. Successivamente, a partire dagli stessi concetti-fenomeni isolati dalle interviste, è stata effettuata un’analisi dei social media per analizzarne l’eco nelle discussioni in lingua italiana.
Lo studio ha considerato diverse decine di milioni di post provenienti da migliaia di sorgenti, pubblicate nel periodo dal luglio 2012 – 30 settembre 2013. In totale sono state prese in considerazione circa 260.000 conversazioni su diversi canali di discussione digitale, come i blog e i forum/community online, ma anche quelle presenti su grandi social network quali twitter e facebook. Questi i numeri coinvolti: 65.000.000 documenti indicizzati, 155.476 documenti provenienti da Forum online, blog e news, e 112.000 tweet.
La ricerca integrale è scaricabile qui. Questo post ha l’obiettivo di riportare integralmente la parte di indagine che mi ha visto coinvolto in prima persona, nell’applicare metriche e strumenti di Social Network Analysis al campione di 112.000 tweet, in lingua italiana, raccolti attorno alle conversazioni social.
L’approccio scelto è stato quello della visual analytics, piuttosto di un utilizzo spinto delle metriche proprietarie della disciplina, e vuole offrire una vista d’insieme cumulativa di tutte le interazioni intercorse nell’intervallo di tempo esaminato.
Due sono le principali linee di indagine: le interazioni tra utenti (reti di conversazioni) e le copresenze degli hashtag (reti di contenuti).
Le reti di ti di conversazioni
Il grafo seguente rappresenta i 112.866 tweet oggetto della ricerca (23.734 i RT) che coinvolgono 31.734 utenti unici con un reach potenziale di 442.709.195.
Ogni utente è rappresentato con un punto (nodo) di diametro proporzionale al numero di RT e mention ricevute. I nodi sono colorati per tipologia. Ogni relazione tra due utenti (RT o mention) è rappresentata con una linea (arco) di spessore proporzionale alla frequenza dell’interazione.
I nodi nell’area centrale del grafo sono quelli maggiormente interconnessi tra di loro e creano engagement più trasversale nelle community degli utenti. I nodi più periferici sono gli influencer per nicchie marginali di utenti; hanno un seguito ed interagiscono con sub-community o pubblici specifici. All’estrema periferia gli utenti che poco o nulla hanno interagito con il nucleo centrale.
L’area centrale è presidiata dagli account ufficiali dei fashion brand, dalle fashion blogger e dai magazine di settore, tutti in grado di dialogare tra di loro e di intercettare un pubblico trasversale e condiviso. La periferia del grafo riporta alcuni utenti che catturano l’attenzione e sono ingaggiati da pubblici specifici, quali le piattaforme di e-commerce dedicate, le celebrities ed alcuni account che sfruttano in modo opportunistico l’evento mediatico per dare rilievo ai propri prodotti o servizi.
Un buon indicatore per misurare la portata di un eventuale influencer è la somma dei RT e delle mention ricevute. Nel nostro caso i 112.000 tweet si traducono in 40.812 RT e mentions, dove il 25% degli influencer copre il 15% delle interazioni totali.
La tabella sottostante riporta un spaccato per tipologia di utente e impatto in termini di engagement:
Type
|
% tweet sent
|
RT e Mentions sent
|
Rt e Mentions received
|
Engagement ratio (1 : n)
|
Celebrities
|
1%
|
10
|
684
|
68,4
|
Opportunistics
|
1%
|
10
|
531
|
53,1
|
E-Commerce platforms
|
2%
|
44
|
1.050
|
23,9
|
Official Brands
|
5%
|
234
|
1.703
|
7,3
|
Magazines
|
10%
|
203
|
1.156
|
5,7
|
Fashion Bloggers
|
20%
|
835
|
979
|
1,2
|
Others
|
61%
|
39.485
|
34.709
|
0,9
|
Total
|
100%
|
40.812
|
40.812
|
Si può osservare che determinate categorie hanno una cassa di risonanza importante in termini di engagement e che, anche partecipando marginalmente o contribuendo in misura minore alle conversazioni, godono di un ottimo rapporto (ratio) tra ingaggi effettuati e ricevuti.
Ad esempio le piattaforme di e-commerce, pur contribuendo in maniera marginale alle conversazioni (2%) hanno un impatto molto buono, ogni ingaggio effettuato ricevono “in cambio” quasi 24 RT/mention. Altra categoria degna di interesse sono le fashion blogger che invece partecipano in maggiore misura alle conversazioni, ma non sono altrettanto influenti in termini di RT e mention ricevute, ottenendo un rapporto di quasi 1:1 tra le menzioni/RT fatte e ricevute.
Reti di contenuti
Twitter, più di altre piattaforme social, si caratterizza per un utilizzo piuttosto marcato degli hashtag che, con la loro forte capacità di sintesi e di evocazione sublimano i contenuti ad un livello di significatività superiore a conversazioni più verbose o ridondate. Risulta quindi molto interessante derivare dall’analisi delle co-presenze e frequenze di utilizzo i messaggi sottesi alla più complessa struttura testuale.
Limitandosi alla semplice analisi di frequenza è interessante rilevare alcune tendenze e curiosità. Gli hashtag più utilizzati sono #moda e #fashion rispettivamente con 25.730 e 46.687 occorrenze. Apparentemente sinonimi sono invece utilizzati in modo diverso: per identificare la moda in quanto tale oppure per sottolinerne gli aspetti più vicini alla tecnologia e all’utilizzo delle piattaforme social.
Per quanto riguarda gli accessori il più rappresentato sono le scarpe (2.364) seguito dai gioielli (1.769). Interessante notare che gli hashtag #donna e #uomo viaggiano quasi appaiati con 1.097 e 1.042 apparizioni.
Spostando il focus sull’analisi delle co-presenze degli hashtag ne possiamo derivare una suggestiva mappatura delle relazioni esistenti. La figura sottostante riporta i principali hashtag, che sono stati utilizzati per almeno 15 volte all’interno dei 112.000 tweet oggetto di indagine. In tutto 9.623 hashtag unici.
Ogni hashtag è rappresentato con un punto (nodo) di diametro proporzionale alla frequanza di utilizzo. Due nodi (hashtag) sono collegati tra di loro se gli hastag sono presenti nello stesso tweet. Utilizzando opportuni algoritmi di community-detection, è possibile evidenziare dove le relazioni sono più reciproche e frequenti con diversi colori. Emergono quattro sub community principali, riferite a quattro distinti cluster tematici (Milano Fashion Week, Paris Fashion Week, Moda, Fashion e tecnologia). Al centro gli hashtag più rappresentati ed interconnessi, in periferia quelli utilizzati meno frequentemente o i raggruppamenti più particolari.
Di particolare interesse, rispetto agli obiettivi di ricerca la community riferita a Fashion e tecnologia, che merita un approfondimento dedicato.
Si nota la presenza importante di hashtag che fanno riferimento ad altre piattaforme social diverse da Twitter, la fa da padrone Instagram, con i suoi hashtag-mantra (#instacool, #instagood, #picoftheday, #instafashion), meno citato ma comunque tra i più utilizzati Pinterest altro social dedicato alla pubblicazione e diffusione di foto e immagini.
Ancora di rilievo hashtag quali #blog e #fashionblogger, a loro volta in relazione con il cluster precedente anche grazie al concetto ponte #outfit. Nota a parte per #chiaraferragni, una delle più seguite fashion blogger, che merita un hashtag dedicato.
#app, #iphone, #ecommerce sono altri termini centrali nella rete di contenuti a testimonianza della stretta correlazione del sistema moda con il mondo della tecnologia e delle piattaforme a supporto dei canali di vendita e promozione.
Link utili
Scarica il report di ricerca completo
Il team di ricerca IBM Italia: @PieroLeo @aVaccina @tiagohbueno @nipalm
#idatisonofashion (Pinterest board)
Moda Cult: Centro per lo studio della moda e della produzione culturale
Un pensiero su “Estratto della ricerca: Il lato fashion dei dati. Social Network Analysis e moda”