Vai al contenuto
Home » Dati e indicatori » Customer Journey Tool » Nota metodologia Customer Journey Tool

Nota metodologia Customer Journey Tool

La sezione di Customer Journey Tool rende disponibile la consultazione dei dati sul comportamento dei visitatori e sui percorsi intrapresi tra le attrazioni della città di Verona attraverso i due tool di Data Clustering e Network Analysis basati sull’elaborazione dei dati rilevati ed aggregati dallo User Generated Content (UCG) di TripAdvisor, la piattaforma che dal 2000 raccoglie le recensioni dei viaggiatori di tutto il Mondo.

Data Clustering

Il tool “Data Clustering” fornisce una serie di informazioni sul comportamento dei visitatori della città di Verona dal 2013 al 2022. I visitatori sono  raggruppati in 9 distinti utenti tipo (Personas) e per ognuno viene riportato il livello di interesse verso altrettante categorie di attrattori. 

La fonte dati è lo UGC di TripAdvisor, ovvero un insieme di recensioni rilasciate da turisti sulla piattaforma, con riferimento specifico alle attrazioni di una data destinazione, in questo caso Verona. 

Il dataset raccoglie tutti i siti e servizi turistici elencati come “Cose da fare” sulla piattaforma TripAdvisor utilizzando un crawler, strutturato con – stima allo stato attuale – 93.879 recensioni dal 2013 al 2022 effettuate dai visitatori delle 692 attrazioni della destinazione Verona. 

Informazioni record database

Con riferimento all’esperienza e al profilo del recensore, ogni singolo record del database contiene le seguenti informazioni: 

  • luogo recensito; 
  • data della recensione (espressa in gg-mm-aaaa); 
  • data della visita (mese e anno);
  • titolo della recensione;
  • punteggio della recensione (da 1 a 5 – non impiegato nel modello);
  • testo della recensione;
  • nome dei recensori;
  • residenza dei recensori;

L’analisi è effettuata con cluster analysis un insieme di tecniche statistiche e informatiche il cui obiettivo è raggruppare una serie di oggetti (le recensioni, nel caso in questione) che sono classificati come simili sulla base di un insieme di variabili (le informazioni sopra riportate, nel nostro caso).

Macrocategorie delle Attrazioni

Le attrazioni individuate sono state raggruppate in otto macrocategorie: 

  • Siti culturali (es. musei); 
  • Punti di riferimento e siti di interesse (es. monumenti);
  • Tour e attività (es. visite guidate ed esperienze);
  • Intrattenimento ed eventi (es. teatri);
  • Siti naturali (es. parchi);
  • Shopping (es. outlet);
  • Bar e club (es. locali notturni);
  • Trasporti e servizi (es. stazioni ferroviarie e servizi navetta);

Algoritmo di clustering K-means

L’algoritmo di clustering (K-means) definisce una serie di Personas, ovvero di gruppi di visitatori tipo formati da utenti con interessi simili fra loro e clusterizzati sulla base delle categorie di attività svolte e recensite durante il periodo di visita. Il tool visualizza tali combinazioni al fine di esplorare nel dettaglio sia le tipologie di cluster/persona individuati che la loro dimensione.

Network Analysis

Il tool “Network Analysis” fornisce una rappresentazione a grafo della rete di attrazioni e percorsi intrapresi da un campione di visitatori di Verona negli anni dal 2013 al 2022.

La fonte dati è lo UGC di TripAdvisor, ovvero un insieme di recensioni rilasciate da turisti sulla piattaforma, con riferimento specifico alle attrazioni di una data destinazione. 

Il dataset raccoglie tutti i siti e servizi turistici elencati come “Cose da fare” sulla piattaforma TripAdvisor utilizzando un crawler, strutturato con – stima allo stato attuale – 93.879 recensioni dal 2013 al 2022 effettuate dai visitatori delle 692 attrazioni della destinazione Verona. 

Informazioni record database

Con riferimento all’esperienza e al profilo del recensore, ogni singolo record del database contiene le seguenti informazioni: 

  • luogo recensito; 
  • data della recensione (espressa in gg-mm-aaaa); 
  • data della visita (mese e anno);
  • titolo della recensione;
  • punteggio della recensione (da 1 a 5 – non impiegato nel modello);
  • testo della recensione;
  • nome dei recensori;
  • residenza dei recensori;

L’analisi è effettuata attraverso una network analysis, basata su tecniche provenienti dalla teoria dei grafi al fine di modellare il comportamento congiunto di una serie di entità (i turisti recensori). 

Grafo

Il grafo permette la rappresentazione dei legami tra le visite alle attrazioni, la loro frequenza e la loro intensità.  

All’interno del grafo, le attrazioni costituiscono i nodi della rete. La dimensione di ogni nodo è data dalla sua rilevanza all’interno del sistema – ovvero dal numero di volte in cui un utente generico ha effettuato una connessione (percorso) tra due nodi. 

Flussi/percorsi turistici

I flussi o percorsi turistici sono invece rappresentati dagli archi che collegano un nodo all’altro. Lo spessore dell’arco indica il numero di volte in cui due attrazioni collegate fra loro sono state visitate congiuntamente. 

NB: Per esigenze di analisi e visualizzazione, è stato introdotto un numero di soglia di minimo 15 collegamenti fra nodi. Collegamenti e interazioni al di sotto di questa soglia non sono stati considerati. 

Le analisi sono state eseguite utilizzando apposite librerie dell’ambiente Python, in particolare il pacchetto NetworkX (Hagberg et al., 2008).