Amazon è una compagnia di commercio elettronico statunitense con sede a Seattle, nello stato di Washington. Lanciata nel 1994 come libreria online, oggi ha allargato la gamma dei prodotti venduti a DVD, CD musicali, software, videogames, ma anche abbigliamento, giocattoli e altro.
Amazon fornisce interfacce di programmazione per accedere al catalogo prodotti, tra queste la Product Advertising API. Questa API può essere interrogata per estrarre i libri più venduti per determinate categorie (es. biologia o tecnologia) oppure ricercare, tra titoli e descrizioni, i testi che contengono determinate parole chiave.
E’ possibile quindi estrarre i bestseller per un determinato tema e capire in che categorie o domini di conoscenza sono catalogati i vari libri. Ad esempio cercando tra i test che contengano nel titolo o nella descrizione i termini “social network analysis” si possono ottenere gli ambiti di applicazione della SNA, almeno quelli più popolari in termini di libri acquistati nel catalogo Amazon.
Nelle figure che seguono sono rappresentate le categorie più diffuse per i 100 bestsellers, in lingua inglese, riguardanti la Social Network Analysis. Ogni nodo rappresenta una categoria, i nodi sono collegati tra loro da un arco se un libro è assegnato a più di una (ad esempio Social Science e Sociology). La dimensione dei nodi è proporzionale al numero di occorrenze, così come lo spessore degli archi.
Science & Nature, Computing & Internet, Education, Social Sciences le categorie più rappresentate; da notare anche le micro categorie che testimoniano particolari nicchie di applicazione.
Altra interessante analisi può essere fatta relativamente alle case editrici, mettendole in relazione con il tipo di contenuti pubblicati.
Nella figura che segue è uno zoom sui principali publisher (nodi blu) e le categorie (nodi azzurri) in cui sono classificati i libri che diffondono; la logica è sempre quella di dare enfasi (dimensione maggiore) a chi pubblica in più categorie (outdegree) e alle categorie più rappresentate (indegree).
Basta un colpo d’occhio per notare quali sono gli editori più presenti, quelli che pubblicano trasversalmente su più categorie e quelli che invece sono più specializzati in una particolare nicchia. Scarica l’immagine completa ad alta risoluzione qui.
E tu, cosa sai fare con questi dati?
Disclaimer
Questo post è da intendersi a puro scopo di ricerca e approfondimento personale. Vi chiedo la gentilezza di segnalarmi eventuali inesattezze, sarà mia cura integrare e modificare il contenuto di questa pagina.
Credits, risorse on line:
Amazon Product Advertising API Best Practices
Download networks in Gephi format (.gephi)
Ciao Alessandro, grazie dell’ottimo articolo. Ho dei problemi, tuttavia, ad aprire i file .gephi…sembrano corrotti…forse è per via di google drive?
Ciao Gabriele, scusa se rispondo solo ora. Ho sostituito i file in google drive con uno zip. Riprova ed eventualmente fammi sapere.
Questo il link aggiornato. Ciao e grazie per l’interessamento.