Tutorial sull'analisi di dati in Excel, in particolare viene affrontata la tematica del controllo, validazione di un database e pulizia dei dati da imprecisioni ed errori di inserimento. I dati sono di natura finanziaria e riguardano gli acquisti effettuati da un'ipotetica azienda in un arco di tempo annuale.
Seguiranno altri due tutorial sulla preparazione dei dati e successiva creazione dei report di sintesi.
Per scaricare il file di esempio copia il link seguente e incollalo sulla barra di ricerca: http://tinyurl.com/p69nl8x
Per essere sempre aggiornato sugli ultimi caricamenti seguici su twitter, pinterest e google+ @suiteufficio o visita il sito www.suiteufficio.it
Se il video è sfocato, riavviare la riproduzione.
1. ORGANIZZARE
IL PROPRIO
LAVORO
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
ANALIZZARE
TAGS
Analizzare dati di speso o fatturato
Formattare una tabella
Controllare e validare un database
Confrontare 2 tabelle
Lavorare con i codici, incrociare informazioni provenienti
da tabelle differenti
Filtri, formattazione, trova-sostituisci funzione cerca vert,
funzione if, funzione val.errore, blocchi, tabelle pivot, uso
della tastiera
2. In questo tutorial viene affrontato il tema del controllo e validazione di un database in Excel
I dati utilizzati, di pura invenzione, sono quelli relativi agli acquisti mensili effettuati da un’azienda manifatturiera X in un
determinato anno. Supponiamo che l’azienda abbia 5 siti produttivi ed ipotizziamo che gli acquisti siano suddivisi in:
diretti - materie prime e confezionamento, confluiscono nel prodotto finito
indiretti - tutto ciò che invece non vi confluisce, ma che è necessario per la sua produzione
CapEx - investimenti, spesa per acquistare beni durevoli
OpEx - spese operative di gestione
e categorizzati rispetto alla tipologia di merce acquistata (macrocategoria e sottocategoria). I dati di speso sono indicati
nella valuta in cui è effettuato l’acquisto.
Supponiamo inoltre che il database sia stato scaricato da un gestionale e che presenti delle imprecisioni da correggere.
L’obiettivo è ottenere un database pulito, il più possibile aderente alla situazione reale, e prepararlo per la
successiva presentazione dei dati.
Nel corso del tutorial si affronteranno i problemi che si possono incontrare nello svolgimento di questa tipologia di analisi
e si mostrerà come è possibile superarli.
La preparazione del database ai fini dell’analisi dati e la creazione di report e grafici di sintesi dei risultati verranno
affrontate nei tutorial successivi.
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
3. CAMPI DATABASE ORIGINALE: DESCRIZIONE E
VALORI
Nome del
campo
Mese
Sito
Sito
produttivo_
produttivo
descr
gen-12
feb-12
IT2
Milano
mar-12
FR1
Parigi
apr-12
FR2
Londra
1
0
giu-12
lug-12
Sulla destra sono
riportate le intestazioni
delle colonne del
database, come sono
in partenza, e i valori
consentiti
ago-12
set-12
I valori assunti da C12
sono riportati nella slide
n.8
Valuta
Numero ordine
Capex
Codice a 4 cifre
identificativo
dell'ordine
Flag che vale 1 nel caso in
cui l'acquisto sia
contabilizzato come un
Capex, 0 se Opex
ott-12
nov-12
Fornitore
Fornitore_desc
dic-12
codice a 3 cifre
identificativo del
fornitore
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
Flag che vale 1 per acquisti
effettuati con ordine
d'acquisto, 0 se effettuati
fuori ordine
Lione
UK1
Ordine/NO
Codice a 3 cifre associato alla
categoria di merce acquistata
Le prime 2 cifre corrispondono
alla macrocategoria, l'ultima
alla sottocategoria
Roma
mag-12
Valori
ammessi e/o
descrizione
IT1
C12
Nome del
fornitore
E' la valuta
utilizzata per
l'acquisto
1
0
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
Spend in valuta
E' il valore monetario
dell‘uscita espresso nella
valuta della transazione
4. IL DATABASE ORIGINALE: CARATTERISTICHE E STRUTTURA
Mese
Il database originale è
costituito da 5.108
righe ed ogni riga
corrisponde ad una
riga di ordine o voce
di uscita, nel caso di
acquisti fuori ordine.
Le colonne sono
quelle già descritte.
Come procediamo per
la validazione?
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
nov-12
apr-12
feb-12
mar-12
giu-12
set-12
ott-12
apr-12
apr-12
apr-12
mar-12
mag-12
gen-12
ott-12
mar-12
feb-12
feb-12
nov-12
gen-12
mar-12
mar-12
apr-12
nov-12
apr-12
set-12
nov-12
apr-12
apr-12
apr-12
nov-12
apr-12
Sito
Sito
produttivo_des
produttivo
cr
UK1
Londra
UK1
Londra
FR2
Lione
FR1
Parigi
FR1
Parigi
IT2
Milano
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
IT1
Roma
FR2
Lione
UK1
Londra
UK1
Londra
FR2
Lione
FR2
Lione
IT2
Milano
IT1
Roma
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
Numero
ordine
7083
5995
2709
2852
2903
5350
6719
5994
5994
5994
5990
4829
2787
6509
5990
2685
2685
5695
4547
5990
5990
5993
7084
5994
6338
7087
5994
6028
6028
6994
5993
Fornitor Fornitore_de
e
sc
1869
690
1950
1728
1654
399
1143
690
690
690
690
261
1827
999
690
1986
1986
579
237
690
690
690
1869
690
837
1911
690
696
696
1512
690
fornitore545
fornitore152
fornitore572
fornitore498
fornitore472
fornitore55
fornitore303
fornitore152
fornitore152
fornitore152
fornitore152
fornitore9
fornitore531
fornitore255
fornitore152
fornitore584
fornitore584
fornitore115
fornitore1
fornitore152
fornitore152
fornitore152
fornitore545
fornitore152
fornitore201
fornitore559
fornitore152
fornitore154
fornitore154
fornitore426
fornitore152
C12
103
021
#
102
102
011
#
021
021
021
021
010
101
120
021
#
#
063
010
021
021
021
011
021
063
121
021
010
010
063
021
Capex
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
Ordine/
Valuta
NO
01
1
00
00
00
1
11
1
1
1
1
1
00
01
1
00
00
1
1
1
1
1
01
1
1
01
1
1
1
01
1
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
CHF
EUR
USD
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
USD
EUR
EUR
EUR
CHF
EUR
EUR
USD
EUR
EUR
EUR
EUR
EUR
Spend in
valuta
1141791,99
891.104,46
806884
546327,83
536998,11
496.000,00
427316
396.781,20
396.781,20
396.781,20
380.198,21
370.400,00
355145,53
335237,76
305.707,61
295182,48
269690,44
249.875,06
236.744,15
230.590,56
230.078,01
215.510,40
208128,33
198.390,60
187.124,00
185176,95
183.143,92
177.972,00
177.972,00
171862,74
169.329,60
5. A. LA PRIMA OSSERVAZIONE DEI DATI
Già dalla prima osservazione
può emergere la presenza di
imprecisioni.
In questo caso:
1) disallineamento dei mesi
2) in C12 sono presenti dei
codici non assegnati (#)
3) nella colonna Capex ci sono
dei numeri memorizzati come
valori (in Excel sono allineati
automaticamente a destra) ed
altri come testo (allineati a
sinistra)
4) nel campo Spend in valuta in
alcune righe c’è il separatore, in
altre no
Correggiamo le imprecisioni.
(clic per video)
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
Sito
Sito
produttivo
produttivo
_descr
nov-12 UK1
Londra
apr-12 UK1
Londra
feb-12 FR2
Lione
mar-12 FR1
Parigi
giu-12 FR1
Parigi
set-12 IT2
Milano
ott-12 UK1
Londra
apr-12 UK1
Londra
apr-12 UK1
Londra
1)
apr-12 UK1
Londra
mar-12 UK1
Londra
mag-12 IT1
Roma
gen-12 FR2
Lione
ott-12 UK1
Londra
mar-12 UK1
Londra
feb-12 FR2
Lione
feb-12 FR2
Lione
nov-12 IT2
Milano
gen-12 IT1
Roma
mar-12 UK1
Londra
mar-12 UK1
Londra
apr-12 UK1
Londra
nov-12 UK1
Londra
apr-12 UK1
Londra
set-12 UK1
Londra
nov-12 UK1
Londra
apr-12 UK1
Londra
apr-12 UK1
Londra
apr-12 UK1
Londra
nov-12 UK1
Londra
apr-12 UK1
Londra
Mese
Numero ordine Fornitore Fornitore_desc
7083
5995
2709
2852
2903
5350
6719
5994
5994
5994
5990
4829
2787
6509
5990
2685
2685
5695
4547
5990
5990
5993
7084
5994
6338
7087
5994
6028
6028
6994
5993
1869
690
1950
1728
1654
399
1143
690
690
690
690
261
1827
999
690
1986
1986
579
237
690
690
690
1869
690
837
1911
690
696
696
1512
690
C12
fornitore545
103
fornitore152
021
3) Testo
fornitore572
#
fornitore498
102
fornitore472
102
3) Valore
fornitore55
011
fornitore303
#
fornitore152
021
fornitore152
021
fornitore152
021
fornitore152
021
fornitore9
010
fornitore531
101
fornitore255 2)
120
fornitore152
021
fornitore584
#
fornitore584
#
fornitore115
063
fornitore1
010
fornitore152
021
fornitore152
021
fornitore152
021
fornitore545
011
fornitore152
021
fornitore201
063
fornitore559
121
fornitore152
021
fornitore154
010
fornitore154
010
fornitore426
063
fornitore152
021
Capex
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
Ordine/
Valuta
NO
01
1
00
00
00
1
11
1
1
1
1
1
00
01
1
00
00
1
1
1
1
1
01
1
1
01
1
1
1
01
1
4)
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
Spend in
valuta
CHF
1141791,99
EUR
891.104,46
USD
806884
EUR
546327,83
EUR
536998,11
Con separatore
EUR
496.000,00
EUR
427316
EUR
396.781,20
EUR
396.781,20
EUR
396.781,20
4)
EUR Senza
380.198,21
separatore
EUR
370.400,00
EUR
355145,53
EUR
335237,76
EUR
305.707,61
EUR
295182,48
EUR
269690,44
EUR
249.875,06
USD
236.744,15
EUR
230.590,56
EUR
230.078,01
EUR
215.510,40
CHF
208128,33
EUR
198.390,60
EUR
187.124,00
USD
185176,95
EUR
183.143,92
EUR
177.972,00
EUR
177.972,00
EUR
171862,74
EUR
169.329,60
6. B. LA VALIDAZIONE - INDIVIDUAZIONE DEI
VALORI NON VALIDI O MANCANTI
A questo punto possiamo procedere con la validazione dei dati. Il primo passo consiste nell’
individuare delle REGOLE DI VALIDAZIONE.
Per identificare le regole:
verifichiamo quali sono i valori validi
per ciascun campo del database
analizziamo le corrispondenze
incrociate, cioè i valori che possono (e
che non possono) essere assunti
contemporaneamente da 2 o più campi
sulla stessa riga
Un metodo che funziona è quello di costruire
uno specchietto per i valori ammissibili e le
corrispondenze incrociate, a cui far riferimento
nella fase di identificazione e correzione degli
errori. Spesso si ha già a disposizione queste
informazioni. In questo caso utilizzeremo la
codifica delle variabili e la tabella delle categorie
merceologiche.
si può fare riferimento alle
informazioni che derivano dalla
conoscenza della realtà analizzata
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
7. Questi sono i valori validi per ciascun campo. Se troviamo dei valori diversi da questi, dobbiamo
correggerli
Per il controllo, se i valori validi sono pochi (meno di 20/25), si
possono utilizzare agevolmente i filtri. In questo caso sfrutteremo
questa tecnica per la verifica di mese e sito produttivo. Se
troviamo dei valori non validi o mancanti li evidenziamo.
(clic per video)
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
I filtri servono ad ordinare e filtrare i dati di una
colonna.
Si attivano selezionando [ordina e filtra -> filtro] nella
barra multifunzione home.
Sono dinamici, nel senso che se filtriamo una colonna
Excel automaticamente filtrerà tutte le colonne
adiacenti (riconosciute dal programma come
appartenenti alla stessa tabella) e se clicchiamo sulla
freccina
mostrerà nella tendina tutti i valori
presenti nella colonna in ordine crescente (sia per
numeri che per stringhe di testo). Se c’è un filtro
attivo, il numero di riga sulla destra è blu. Per
visualizzare tutte le righe della tabella quando c’è un
filtro attivo ma senza rimuovere il filtro selezionare
[cancella] nel menù Ordina e filtra
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
8. MACROCATEGORIA
A destra la tabella riportante le
categorie merceologiche
d’acquisto.
MACROCATEGORIA
E’ la categoria di livello superiore
SOTTOCATEGORIA
E’ sempre associata alla
macrocategoria a cui appartiene
C12
E’ il codice completo, costituito
dall’unione di macrocategoria e
sottocategoria
Es. per “Materie prime” è
C1
01
C2
1
C12
011
D/I
Classificazione in acquisti diretti,
indiretti o non applicabile
Ordine/NO
1 per merci acquistate con ordine
d’acquisto, 0 per Spend fuori
ordine
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
C1
01
01
02
02
02
03
04
04
05
05
05
05
06
06
06
07
07
07
08
08
08
08
08
09
09
09
10
10
10
11
11
11
12
98
98
98
99
99
SOTTOCATEGORIA
C1_descrizione
Materiali
Materiali
Confezionamento
Confezionamento
Confezionamento
Acquisti diretti non categorizzati
Servizi generali
Servizi generali
Utilities
Utilities
Utilities
Utilities
Strumenti e parti di ricambio
Strumenti e parti di ricambio
Strumenti e parti di ricambio
Trasporti
Trasporti
Trasporti
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Marketing
Marketing
Marketing
Consulenze e outsourcing
Consulenze e outsourcing
Consulenze e outsourcing
Viaggi di lavoro
Viaggi di lavoro
Viaggi di lavoro
Acquisti indiretti non categorizzati
Spese finanziarie
Spese finanziarie
Spese finanziarie
Dipendenti e spese per il sociale
Dipendenti e spese per il sociale
C2
1
2
1
2
3
0
1
2
1
2
3
4
1
2
3
1
2
3
1
2
3
4
5
1
2
3
1
2
3
1
2
3
0
1
2
3
1
2
C2_descrizione
Materie prime
Semilavorati
Imballaggio primario
Imballaggio secondario
Etichette
Acquisti diretti non categorizzati
Servizi
Manutenzione
Energia elettrica
Gas
Acqua
Altre tipologie di energia
Strumenti
Manutenzione
Parti di ricambio
Costi consegna prodotti
Trasporti a mezzo corriere
Altri costi di trasporto
Hardware IT
Software
Reti
Telecomunicazione
Cancelleria
Merchandising
Pubblicità
Sponsorizzazioni
Consulenti
Servizi in outsourcing
Traduzioni
Alloggio
Trasporto
Rimborsi spese
Acquisti indiretti non categorizzati
Interessi
Servizi bancari
Imposte e tasse
Costo del personale
Donazioni
C12
011
012
021
022
023
030
041
042
051
052
053
054
061
062
063
071
072
073
081
082
083
084
085
091
092
093
101
102
103
111
112
113
120
981
982
983
991
992
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
D/I
Diretti
Diretti
Diretti
Diretti
Diretti
Diretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
N/A
N/A
N/A
N/A
N/A
Ordine/NO
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
9. 1
Per verificare l’esistenza dei
codici riportati in [C12],
possiamo inserire una
colonna nuova, che
chiameremo [C12_check] e
ricercare i codici nella tabella
delle categorie (foglio
“categorie”). La funzione più
adatta per effettuare
quest’operazione è senza
dubbio il cerca verticale
combinato con le funzioni
se e val.errore
2
IL CERCA VERTICALE
Il cerca verticale serve a ricercare un valore all’interno di un elenco di valori. Per un dato valore
X restituisce un valore Y di una colonna della tabella di origine appartenente alla stessa riga di
X
La sintassi
1
2
3
4
=CERCA.VERT(VALORE;TABELLA;INDICE;INTERVALLO)
1) Cella in cui è contenuto il valore da ricercare
2) Il posto dove bisogna ricercare il valore specificato in VALORE
3) Indica il numero di colonne dalla prima della TABELLA, in cui è contenuto il valore da
restituire. II valore da ricercare deve essere collocato per forza nella prima colonna
4) E’ 0 se si vuole che cerchi il valore esatto, 1 se si consente di ricercare per
approssimazioni
Un esempio pratico
Se ricerchiamo il valore 030 nella tabella categorie, e impostiamo il Cerca vert chiedendogli di
resituirci la seconda colonna a partire da C12 (vedi freccia nella tabella categorie in alto), il
risultato sarà “Diretti”.
Indice: il valore è nella colonna F
La formula sarà:
IL VALORE
RESTITUITO
E’ la cella in cui è contenuto
il valore da ricercare
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
Il foglio + l’intervallo in cui c’è la tabella
dove cercare il valore in G18
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
10. LA FUNZIONE SE – sintassi
LA FUNZIONE VAL.ERRORE
La funzione Val.errore serve ad identificare
gli errori (#N/D, #RIF, etc.) in un database.
Per verificare l’esistenza dei
codici riportati in [C12],
possiamo inserire una
colonna nuova, che
chiameremo [C12_check] e
ricercare i codici nella tabella
delle categorie (foglio
“categorie”). La funzione più
adatta per effettuare
quest’operazione è senza
dubbio il cerca verticale
combinato con le funzioni
se e val.errore
Sintassi
Val.errore(cella)
Da come risultato VERO se il valore
contenuto nella cella è un errore, FALSO
altrimenti.
E’ molto utlizzata in abbinamento a
funzioni di ricerca
1
2
3
SE(CONDIZIONE; SE_VERO; SE_FALSO)
1) E’ un test (ad esempio A1<1; A2=A3)
2) E’ l’istruzione che viene applicata se il test dà
come risultato VERO (ad esempio A1+A2)
2) E’ l’azione da fare se il risultato è FALSO (es.
A1-A2)
USO DEI BLOCCHI
I blocchi $ servono a bloccare i riferimenti di una formula per far sì che questi non
cambino se trasciniamo la formula in altre celle del foglio di lavoro. Per il cerca.vert
di solito viene bloccata la tabella dove viene ricercato il valore (come si vedrà nel
video). Esempi di blocchi:
(clic per video)
Intervallo
Come attivarlo
$A$1:$B$5
Righe e colonne
Selezioniamo nella formula A1:B5 e premiamo sulla
tastiera F4
A$1:B$5
Solo righe
Selezioniamo A1:B5 e premiamo 2 volte F4
$A1:$B5
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
Oggetto del
blocco
Solo colonne
Selezioniamo A1:B5 e premiamo 3 volte F4
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
11. Per l’analisi delle corrispondenze incrociate, lo strumento migliore è senza dubbio la tabella pivot. Prima di
effettuare l’analisi occorre fare un ragionamento su quali sono nel caso specifico le corrispondenze da
verificare, considerando anche le informazioni che provengono dalla conoscenza del fenomeno studiato.
1) Ci sono delle categorie
per cui gli acquisti
vengono effettuati fuori
ordine (Ordine/NO=0).
Controlliamo se nel
database viene rispettata
questa regola
(clic per video)
MACROCATEGORIA
C1
06
07
07
07
08
08
11
12
98
98
98
99
99
SOTTOCATEGORIA
C1_descrizione
Strumenti e parti di ricambio
Trasporti
Trasporti
Trasporti
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Viaggi di lavoro
Acquisti indiretti non categorizzati
Spese finanziarie
Spese finanziarie
Spese finanziarie
Dipendenti e spese per il sociale
Dipendenti e spese per il sociale
C2
3
1
2
3
1
2
3
0
1
2
3
1
2
C2_descrizione
Parti di ricambio
Costi consegna prodotti
Trasporti a mezzo corriere
Altri costi di trasporto
Hardware IT
Software
Rimborsi spese
Acquisti indiretti non categorizzati
Interessi
Servizi bancari
Imposte e tasse
Costo del personale
Donazioni
C12
063
071
072
073
081
082
113
120
981
982
983
991
992
D/I
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
N/A
N/A
N/A
N/A
N/A
La tabella pivot è una tabella dinamica in cui possiamo inserire i campi appartenenti al
database di origine e creare tabelle di frequenza o semplicemente rappresentare un
fenomeno a 2 dimensioni. E’ simile al filtro, con la differenza che qui possiamo
lavorare incrociando due o più dimensioni contemporaneamente ed ottenere degli
indici di sintesi - conteggio, somma, minimo, massimo, media.
Si compila trascinando i campi (in elenco campi tabella pivot) che ci interessano nello
spazio dedicato.
Gli spazi sono:
• filtro rapporto – per filtrare le informazioni da visualizzare in base al valore/valori di
uno o più campi (come i filtri normali)
• etichette di riga e colonna
• Somma valori – per decidere il campo dei valori da sommare/contare/etc. (ad
esempio possiamo sommare i valori dello Spend o contare il numero di fornitori)
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
Ordine/NO
1
1
0
1
1
1
1
1
0
0
0
0
0
12. 2) Un’informazione derivata dalla
conoscenza della realtà analizzata è che gli
acquisti diretti non possono essere
investimenti (Capex), per cui controlliamo che
ai codici C12 diretti sia sempre associato
Capex=0
Per effettuare il controllo utilizziamo la stessa
procedura mostrata per il punto 1),
selezionando questa volta i codici C12
classificati come “acquisti diretti” nella tabella
categorie. Verifichiamo nella pivot che non ci
siano codici classificati come Capex
(Capex=1), se li troviamo li evidenziamo di
rosso
C12
011
012
021
022
023
030
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
Acquisti Diretti Indiretti
Diretti
Diretti
Diretti
Diretti
Diretti
Diretti
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
Ci sono 12
righe con
codice 030
classificate
come Capex
13. C. LA VALIDAZIONE – CORREZIONE DEI VALORI
NON VALIDI E IMPUTAZIONE DI QUELLI MANCANTI
Per correggere i valori non validi e imputare i valori mancanti si possono utilizzare diverse
tecniche:
Se riconosciamo errori di digitazione troviamo il valore valido più vicino e li correggiamo di
conseguenza
I valori che non rispettano le regole di corrispondenza incrociata (vedi la tabella
categoria) possono essere corretti sulla base di queste
Se esistono dei valori generici, (es. 030 - acquisti diretti non categorizzati, 120 - acquisti
indiretti non categorizzati) possono essere assegnati ai valori mancanti
I valori mancanti possono essere imputati guardando le righe con valori degli altri campi
simili a quelli della riga in cui è contenuto il mancante
Anche in questo caso si può fare affidamento alla conoscenza diretta del fenomeno
Si può recuperare il documento originario (es. ordine d’acquisto, bolla di consegna, fattura,
etc.), compatibilmente con la sua disponibilità, e verificare il valore direttamente alla fonte
La scelta delle tecniche da utilizzare dipende dal tempo a disposizione, dalla presenza di regole di
validazione e dall’importanza del dato da correggere. Si può anche utilizzare più tecniche insieme
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
14. Analizziamo con le tecniche descritte, uno alla volta, i campi in cui abbiamo
riscontrato valori non validi.
SITO PRODUTTIVO
Sito produttivo
Filtriamo per colore
rosso
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
FR21
FR21
FR21
FR21
FR21
FR21
FR21
FR21
FR21
FR21
FR21
Sito
produttivo_descr
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Lione
Lione
Lione
Lione
Lione
Lione
Lione
Lione
Lione
Lione
Lione
E’ evidente che i due valori
non validi sono errori di
digitazione. Possiamo
correggerli con il TROVA
SOSTITUISCI
IT2f si sostituisce con IT2
FR21 con FR2
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
15. C12
Bisogna correggere i valori per cui il check aveva dato come risultato “no”. Nella tabella seguente
vengono elencati i valori da correggere, la procedura scelta per la correzione e il valore valido di
sostituzione
Valore
Metodo di correzione
Valore
valido
98
Errore di digitazione: cerchiamo il valore valido più
vicino (nella stessa macrocategoria)
981
120
E’ un problema di formati in quanto il valore
esiste. Possiamo ignorarlo.
#
Scegliamo una regola per i valori mancanti: li
assegnamo alle categorie generiche di acquisti
diretti ed indiretti (assegniamo i Capex agli
indiretti e gli Opex ai diretti)
030 per gli
Opex, 120
per i Capex
010
Errore di digitazione: cerchiamo il valore valido più
vicino (nella stessa macrocategoria)
011
027
Errore di digitazione: cerchiamo il valore valido più
vicino (nella stessa macrocategoria)
023
Nella ricerca del valore sostitutivo possiamo anche considerare
la tipologia di merce venduta dal fornitore associato al valore
errato, utilizzando la nostra conoscenza della realtà analizzata
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
Se mentre procediamo con la
correzione sostituiamo ai valori
errati i valori consentiti e
lasciamo la formula in check
attiva, questa si aggiornerà
contemporaneamente alla
correzione. A correzione
ultimata i “no” dovrebbero
essere sostituiti
completamente dagli “ok”
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
16. VALIDAZIONI INCROCIATE
Sfruttando la tabella pivot e l’identificatore andiamo a correggere tutte le incompatibilità riscontrate
nella verifica incrociata, con la quale avevamo evidenziato:
i conteggi delle righe che avevano ORDINE/NO=1 con un codice C12 per cui era
consentito solo il valore ORDINE/NO=0
i conteggi delle posizioni di ordine classificate negli acquisti diretti e con flag Capex=1 (un
acquisto diretto non può essere un investimento!!)
Per la sostituzione si possono utilizzare 2 metodi differenti:
a)
Se le righe conteggiate sono poche, le correggiamo utilizzando il comando “mostra dettagli”
(doppio clic sul conteggio dei valori non validi ed modificando il valore direttamente nel
database
b)
Se le righe sono più di 5 utilizziamo il comando “mostra dettagli” per la tabella pivot e
facciamo la correzione con il cerca.vert
Nel prossimo video verranno
applicate entrambe le
metodologie (metodo a per
Capex, metodo b per
ORDINE/NO)
(clic per video)
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
L’inserimento di un campo chiave primaria (ID) è molto
utile quando si lavora con i database. In particolare lo è per
le azioni di ricerca e selezione, in quanto è identificatore
univoco di ciascuna riga. Nel nostro esempio avere l’ID
significa poter automatizzare con una formula (metodo b) la
ricerca dei valori non validi nel database invece che farlo
riga per riga (metodo a)
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
17. In conclusione, ripercorriamo gli step che abbiamo seguito in questa prima analisi e validazione dei
dati:
Osservazione del database e delle codifiche, se presenti
Formattazione del database per uniformare gli allineamenti e formati
Individuazione delle regole di validazione
Ricerca dei valori non validi
Correzione dei valori non validi e imputazione di quelli mancanti
Le funzionalità di Excel che abbiamo utilizzato sono:
Filtri
Trova-sostituisci
Tabelle pivot (formattazione, mostra dettagli)
Funzioni se(), val.errore() e cerca,vert()
Questo tutorial ha per oggetto dati relativi agli acquisti, ma le metodologie descritte hanno un ambito
di applicazione più generale (vendite, fatturato, spedizioni, etc.) che prescinde dalla natura del dato.
Nel prossimo tutorial il database verrà preparato per la creazione dei report di sintesi
ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE
CONTROLLARE E VALIDARE UN DATABASE IN EXCEL