Leggere e comprendere i dati: Metodi e strumenti

Analisi dei dati – Correlazione Vs. causalità

Quando si analizzano i dati, ci sono tre aspetti a cui bisogna prestare attenzione per garantire che i dati siano accurati e che qualsiasi storia basata su un dato dato sia coerente.

1) Correlazione Vs. causalità 

Il malinteso più comune che si verifica durante la lettura e l’analisi dei dati, è la differenza tra correlazione e causalità.

Correlazione

Descrive i modelli nelle relazioni reciproche tra le variabili. Quindi, se una variabile cambia, anche l’altra tende a farlo, e viceversa – non importa da quale iniziamo.

Causalità

Descrive le relazioni tra variabili che hanno un’azione e una direzione.

Variabile di confusione: una variabile che offusca altre relazioni e rende le variabili direttamente correlate, quando non lo sono. Le variabili di confusione di solito sono:

  • Reddito
  • Età
  • Sesso
  • Livello d’istruzione
  • Razza

Quando si analizzano i dati, è necessario cercare di identificare queste variabili di confusione, poiché possono capovolgere una correlazione tra positivo e negativo, mascherare completamente una relazione o addirittura creare l’illusione di una relazione. Queste variabili possono anche essere qualcosa di difficile da misurare. 

Identificare se due variabili sono legate da correlazione o causalità non è sempre semplice e il modo migliore per determinarlo è sviluppare uno studio che controlli lo scenario per evitare le variabili di confusione. 

Watch this video before you continue: Misconceptions in Data Analysis. Study Hall Data Literacy

Analisi dei dati – Legge dei grandi numeri e domande chiave

2) Legge dei grandi numeri

Quando si prendono decisioni sui dati, una buona pratica è quella di seguire la legge dei grandi numeri. Si dovrebbe sempre cercare di capire e avere accesso alla dimensione del campione per analizzare criticamente la media, la mediana o la modalità del campione 

Legge dei grandi numeri – più grande è un campione casuale, più la sua media dovrebbe essere vicina alla vera media della popolazione.

3) Domande chiave

Al di là di una maggiore attenzione alle variabili confondenti e alla legge dei grandi numeri, è anche fondamentale porsi alcune domande quando si analizzano i dati: 

  • Da dove vengono i dati?
  • Chi ha analizzato i dati?
  • Cosa manca all’analisi dei dati? (come è stato raccolto il campione? Quanto era grande?

A picture containing person, outdoor, sunglasses, wearing

Description automatically generated