FINANCIAL PLANNING
FINANCIAL PLANNING
Uno strumento semplice e "potente" per analizzare in modo veloce una grande mole di dati
Ad ognuno di noi é capitato (o capita quotidianamente) di aver a che fare con database anche molto grandi.
Spesso diamo per scontato che i numeri in esso contenuti siano corretti e partiamo subito con pivot, grafici... e report. Ma chi ci dice che nelle migliaia di righe che stiamo analizzando non ci siano degli errori? Spesso lo si scopre dopo, quando l'occhio attento di un collega (o del capo...) fa quella mitica domandina "Ma questo valore così alto a cosa é dovuto?"... e tutto il nostro duro lavoro di analisi diventa di colpo vano perché abbiamo saltato il primo e fondamentale passaggio: la verifica a priori dei dati!
E qui arriva in aiuto il "5 number summary", uno strumento molto potente di cui, una volta familiarizzato, non potremo più fare a meno!
Di cosa si tratta? Di 5 grandezze statistiche! Eccole di seguito:
Minimo: semplice... rappresenta il valore più piccolo del set di dati...
1° quartile: presa la nostra distribuzione di dati, il primo quartile considera solo il primo 25% e rappresenta il numero massimo
Mediana (o 2° quartile): é quel valore che divide in 2 una distribuzione (avremo il 50% della distribuzione prima ed il 50% dopo)
3° quartile: se il 1° quartile rappresentava il primo 25%, il 3° quartile rappresenta il 75%
Massimo: il valore maggiore
Con un esempio scoprirete che é più semplice di quanto si pensi...
Come potete vedere, prendendo in esame la prima colonna della tabella ossia i "ricavi":
Sui 15 elementi del nostro set di dati, il primo corrisponde al minimo, essendo il preventivo con il valore inferiore
Il primo quartile per 1.017,5€ corrisponde alla media del 4° e 5° preventivo
la mediana corrisponde al preventivo n°8
Il terzo quartile corrisponde alla media del 11° e 12° preventivo
Il preventivo n°15 é il valore massimo
Ci sono degli outliers (valori anomali)? No, i dati dell'esempio sembrano corretti, quindi nulla da approfondire!
Vediamo lo stesso esempio, in cui é stato modificato solo il preventivo numero 6
Ora ci sono degli outliers (valori anomali)? Direi proprio di si...
Essendo intervenuta la modifica oltre il 1° quartile, noterete che i valori "minimo" e "1° quartile" sono rimasti invariati.
La "media" ed il "secondo quartile" sono variati leggermente, ma é il valore "massimo" che dovrebbe allertarci!
E' corretto quel preventivo da 2.500€?
Oltre al "five number summary", qualora preferiate un sistema più "visivo", suggeriamo di provare anche solo con un grafico "a dispersione". In presenza di outliers, noterete dei puntini isolati nel grafico che dovranno essere oggetto di analisi!