Analisi dei dati – Correlazione Vs. causalità
Quando si analizzano i dati, ci sono tre aspetti a cui bisogna prestare attenzione per garantire che i dati siano accurati e che qualsiasi storia basata su un dato dato sia coerente.
1) Correlazione Vs. causalità
Il malinteso più comune che si verifica durante la lettura e l’analisi dei dati, è la differenza tra correlazione e causalità.
Correlazione
Descrive i modelli nelle relazioni reciproche tra le variabili. Quindi, se una variabile cambia, anche l’altra tende a farlo, e viceversa – non importa da quale iniziamo.
Causalità
Descrive le relazioni tra variabili che hanno un’azione e una direzione.
Variabile di confusione: una variabile che offusca altre relazioni e rende le variabili direttamente correlate, quando non lo sono. Le variabili di confusione di solito sono:
Quando si analizzano i dati, è necessario cercare di identificare queste variabili di confusione, poiché possono capovolgere una correlazione tra positivo e negativo, mascherare completamente una relazione o addirittura creare l’illusione di una relazione. Queste variabili possono anche essere qualcosa di difficile da misurare.
Identificare se due variabili sono legate da correlazione o causalità non è sempre semplice e il modo migliore per determinarlo è sviluppare uno studio che controlli lo scenario per evitare le variabili di confusione.
Watch this video before you continue: “Misconceptions in Data Analysis. Study Hall Data Literacy”
Analisi dei dati – Legge dei grandi numeri e domande chiave
2) Legge dei grandi numeri
Quando si prendono decisioni sui dati, una buona pratica è quella di seguire la legge dei grandi numeri. Si dovrebbe sempre cercare di capire e avere accesso alla dimensione del campione per analizzare criticamente la media, la mediana o la modalità del campione
Legge dei grandi numeri – più grande è un campione casuale, più la sua media dovrebbe essere vicina alla vera media della popolazione.
3) Domande chiave
Al di là di una maggiore attenzione alle variabili confondenti e alla legge dei grandi numeri, è anche fondamentale porsi alcune domande quando si analizzano i dati: