SlideShare una empresa de Scribd logo
1 de 17
ORGANIZZARE
IL PROPRIO
LAVORO

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

ANALIZZARE

TAGS
Analizzare dati di speso o fatturato
Formattare una tabella
Controllare e validare un database
Confrontare 2 tabelle
Lavorare con i codici, incrociare informazioni provenienti
da tabelle differenti
Filtri, formattazione, trova-sostituisci funzione cerca vert,
funzione if, funzione val.errore, blocchi, tabelle pivot, uso
della tastiera
In questo tutorial viene affrontato il tema del controllo e validazione di un database in Excel
I dati utilizzati, di pura invenzione, sono quelli relativi agli acquisti mensili effettuati da un’azienda manifatturiera X in un
determinato anno. Supponiamo che l’azienda abbia 5 siti produttivi ed ipotizziamo che gli acquisti siano suddivisi in:






diretti - materie prime e confezionamento, confluiscono nel prodotto finito
indiretti - tutto ciò che invece non vi confluisce, ma che è necessario per la sua produzione
CapEx - investimenti, spesa per acquistare beni durevoli
OpEx - spese operative di gestione

e categorizzati rispetto alla tipologia di merce acquistata (macrocategoria e sottocategoria). I dati di speso sono indicati
nella valuta in cui è effettuato l’acquisto.
Supponiamo inoltre che il database sia stato scaricato da un gestionale e che presenti delle imprecisioni da correggere.

L’obiettivo è ottenere un database pulito, il più possibile aderente alla situazione reale, e prepararlo per la
successiva presentazione dei dati.
Nel corso del tutorial si affronteranno i problemi che si possono incontrare nello svolgimento di questa tipologia di analisi
e si mostrerà come è possibile superarli.
La preparazione del database ai fini dell’analisi dati e la creazione di report e grafici di sintesi dei risultati verranno
affrontate nei tutorial successivi.

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
CAMPI DATABASE ORIGINALE: DESCRIZIONE E
VALORI
Nome del
campo

Mese

Sito
Sito
produttivo_
produttivo
descr

gen-12
feb-12

IT2

Milano

mar-12

FR1

Parigi

apr-12

FR2

Londra

1

0

giu-12
lug-12

Sulla destra sono
riportate le intestazioni
delle colonne del
database, come sono
in partenza, e i valori
consentiti

ago-12
set-12

I valori assunti da C12
sono riportati nella slide
n.8
Valuta

Numero ordine
Capex
Codice a 4 cifre
identificativo
dell'ordine

Flag che vale 1 nel caso in
cui l'acquisto sia
contabilizzato come un
Capex, 0 se Opex

ott-12
nov-12

Fornitore

Fornitore_desc

dic-12
codice a 3 cifre
identificativo del
fornitore

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

Flag che vale 1 per acquisti
effettuati con ordine
d'acquisto, 0 se effettuati
fuori ordine

Lione

UK1

Ordine/NO

Codice a 3 cifre associato alla
categoria di merce acquistata
Le prime 2 cifre corrispondono
alla macrocategoria, l'ultima
alla sottocategoria

Roma

mag-12

Valori
ammessi e/o
descrizione

IT1

C12

Nome del
fornitore

E' la valuta
utilizzata per
l'acquisto

1
0

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

Spend in valuta
E' il valore monetario
dell‘uscita espresso nella
valuta della transazione
IL DATABASE ORIGINALE: CARATTERISTICHE E STRUTTURA
Mese

Il database originale è
costituito da 5.108
righe ed ogni riga
corrisponde ad una
riga di ordine o voce
di uscita, nel caso di
acquisti fuori ordine.
Le colonne sono
quelle già descritte.

Come procediamo per
la validazione?

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

nov-12
apr-12
feb-12
mar-12
giu-12
set-12
ott-12
apr-12
apr-12
apr-12
mar-12
mag-12
gen-12
ott-12
mar-12
feb-12
feb-12
nov-12
gen-12
mar-12
mar-12
apr-12
nov-12
apr-12
set-12
nov-12
apr-12
apr-12
apr-12
nov-12
apr-12

Sito
Sito
produttivo_des
produttivo
cr
UK1
Londra
UK1
Londra
FR2
Lione
FR1
Parigi
FR1
Parigi
IT2
Milano
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
IT1
Roma
FR2
Lione
UK1
Londra
UK1
Londra
FR2
Lione
FR2
Lione
IT2
Milano
IT1
Roma
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra
UK1
Londra

Numero
ordine
7083
5995
2709
2852
2903
5350
6719
5994
5994
5994
5990
4829
2787
6509
5990
2685
2685
5695
4547
5990
5990
5993
7084
5994
6338
7087
5994
6028
6028
6994
5993

Fornitor Fornitore_de
e
sc
1869
690
1950
1728
1654
399
1143
690
690
690
690
261
1827
999
690
1986
1986
579
237
690
690
690
1869
690
837
1911
690
696
696
1512
690

fornitore545
fornitore152
fornitore572
fornitore498
fornitore472
fornitore55
fornitore303
fornitore152
fornitore152
fornitore152
fornitore152
fornitore9
fornitore531
fornitore255
fornitore152
fornitore584
fornitore584
fornitore115
fornitore1
fornitore152
fornitore152
fornitore152
fornitore545
fornitore152
fornitore201
fornitore559
fornitore152
fornitore154
fornitore154
fornitore426
fornitore152

C12
103
021
#
102
102
011
#
021
021
021
021
010
101
120
021
#
#
063
010
021
021
021
011
021
063
121
021
010
010
063
021

Capex

0

0
0
0
0
0
0

0

1
0
0
0
0
0
0
0
0
0
0

Ordine/
Valuta
NO
01
1
00
00
00
1
11
1
1
1
1
1
00
01
1
00
00
1
1
1
1
1
01
1
1
01
1
1
1
01
1

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

CHF
EUR
USD
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
EUR
USD
EUR
EUR
EUR
CHF
EUR
EUR
USD
EUR
EUR
EUR
EUR
EUR

Spend in
valuta
1141791,99
891.104,46
806884
546327,83
536998,11
496.000,00
427316
396.781,20
396.781,20
396.781,20
380.198,21
370.400,00
355145,53
335237,76
305.707,61
295182,48
269690,44
249.875,06
236.744,15
230.590,56
230.078,01
215.510,40
208128,33
198.390,60
187.124,00
185176,95
183.143,92
177.972,00
177.972,00
171862,74
169.329,60
A. LA PRIMA OSSERVAZIONE DEI DATI
Già dalla prima osservazione
può emergere la presenza di
imprecisioni.
In questo caso:
1) disallineamento dei mesi
2) in C12 sono presenti dei
codici non assegnati (#)
3) nella colonna Capex ci sono
dei numeri memorizzati come
valori (in Excel sono allineati
automaticamente a destra) ed
altri come testo (allineati a
sinistra)

4) nel campo Spend in valuta in
alcune righe c’è il separatore, in
altre no
Correggiamo le imprecisioni.
(clic per video)

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

Sito
Sito
produttivo
produttivo
_descr
nov-12 UK1
Londra
apr-12 UK1
Londra
feb-12 FR2
Lione
mar-12 FR1
Parigi
giu-12 FR1
Parigi
set-12 IT2
Milano
ott-12 UK1
Londra
apr-12 UK1
Londra
apr-12 UK1
Londra
1)
apr-12 UK1
Londra
mar-12 UK1
Londra
mag-12 IT1
Roma
gen-12 FR2
Lione
ott-12 UK1
Londra
mar-12 UK1
Londra
feb-12 FR2
Lione
feb-12 FR2
Lione
nov-12 IT2
Milano
gen-12 IT1
Roma
mar-12 UK1
Londra
mar-12 UK1
Londra
apr-12 UK1
Londra
nov-12 UK1
Londra
apr-12 UK1
Londra
set-12 UK1
Londra
nov-12 UK1
Londra
apr-12 UK1
Londra
apr-12 UK1
Londra
apr-12 UK1
Londra
nov-12 UK1
Londra
apr-12 UK1
Londra
Mese

Numero ordine Fornitore Fornitore_desc
7083
5995
2709
2852
2903
5350
6719
5994
5994
5994
5990
4829
2787
6509
5990
2685
2685
5695
4547
5990
5990
5993
7084
5994
6338
7087
5994
6028
6028
6994
5993

1869
690
1950
1728
1654
399
1143
690
690
690
690
261
1827
999
690
1986
1986
579
237
690
690
690
1869
690
837
1911
690
696
696
1512
690

C12

fornitore545
103
fornitore152
021
3) Testo
fornitore572
#
fornitore498
102
fornitore472
102
3) Valore
fornitore55
011
fornitore303
#
fornitore152
021
fornitore152
021
fornitore152
021
fornitore152
021
fornitore9
010
fornitore531
101
fornitore255 2)
120
fornitore152
021
fornitore584
#
fornitore584
#
fornitore115
063
fornitore1
010
fornitore152
021
fornitore152
021
fornitore152
021
fornitore545
011
fornitore152
021
fornitore201
063
fornitore559
121
fornitore152
021
fornitore154
010
fornitore154
010
fornitore426
063
fornitore152
021

Capex

0

0
0
0
0
0
0

0

1
0
0
0
0
0
0
0
0
0
0

Ordine/
Valuta
NO
01
1
00
00
00
1
11
1
1
1
1
1
00
01
1
00
00
1
1
1
1
1
01
1
1
01
1
1
1
01
1

4)

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

Spend in
valuta

CHF
1141791,99
EUR
891.104,46
USD
806884
EUR
546327,83
EUR
536998,11
Con separatore
EUR
496.000,00
EUR
427316
EUR
396.781,20
EUR
396.781,20
EUR
396.781,20
4)
EUR Senza
380.198,21
separatore
EUR
370.400,00
EUR
355145,53
EUR
335237,76
EUR
305.707,61
EUR
295182,48
EUR
269690,44
EUR
249.875,06
USD
236.744,15
EUR
230.590,56
EUR
230.078,01
EUR
215.510,40
CHF
208128,33
EUR
198.390,60
EUR
187.124,00
USD
185176,95
EUR
183.143,92
EUR
177.972,00
EUR
177.972,00
EUR
171862,74
EUR
169.329,60
B. LA VALIDAZIONE - INDIVIDUAZIONE DEI
VALORI NON VALIDI O MANCANTI
A questo punto possiamo procedere con la validazione dei dati. Il primo passo consiste nell’
individuare delle REGOLE DI VALIDAZIONE.
Per identificare le regole:

 verifichiamo quali sono i valori validi
per ciascun campo del database

 analizziamo le corrispondenze
incrociate, cioè i valori che possono (e
che non possono) essere assunti
contemporaneamente da 2 o più campi
sulla stessa riga

Un metodo che funziona è quello di costruire
uno specchietto per i valori ammissibili e le
corrispondenze incrociate, a cui far riferimento
nella fase di identificazione e correzione degli
errori. Spesso si ha già a disposizione queste
informazioni. In questo caso utilizzeremo la
codifica delle variabili e la tabella delle categorie
merceologiche.

 si può fare riferimento alle
informazioni che derivano dalla
conoscenza della realtà analizzata

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
Questi sono i valori validi per ciascun campo. Se troviamo dei valori diversi da questi, dobbiamo
correggerli

Per il controllo, se i valori validi sono pochi (meno di 20/25), si
possono utilizzare agevolmente i filtri. In questo caso sfrutteremo
questa tecnica per la verifica di mese e sito produttivo. Se
troviamo dei valori non validi o mancanti li evidenziamo.
(clic per video)

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

I filtri servono ad ordinare e filtrare i dati di una
colonna.
Si attivano selezionando [ordina e filtra -> filtro] nella
barra multifunzione home.
Sono dinamici, nel senso che se filtriamo una colonna
Excel automaticamente filtrerà tutte le colonne
adiacenti (riconosciute dal programma come
appartenenti alla stessa tabella) e se clicchiamo sulla
freccina
mostrerà nella tendina tutti i valori
presenti nella colonna in ordine crescente (sia per
numeri che per stringhe di testo). Se c’è un filtro
attivo, il numero di riga sulla destra è blu. Per
visualizzare tutte le righe della tabella quando c’è un
filtro attivo ma senza rimuovere il filtro selezionare
[cancella] nel menù Ordina e filtra

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
MACROCATEGORIA

A destra la tabella riportante le
categorie merceologiche
d’acquisto.

MACROCATEGORIA
E’ la categoria di livello superiore
SOTTOCATEGORIA
E’ sempre associata alla
macrocategoria a cui appartiene
C12
E’ il codice completo, costituito
dall’unione di macrocategoria e
sottocategoria
Es. per “Materie prime” è

C1

01

C2

1

C12

011

D/I
Classificazione in acquisti diretti,
indiretti o non applicabile
Ordine/NO
1 per merci acquistate con ordine
d’acquisto, 0 per Spend fuori
ordine

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

C1
01
01
02
02
02
03
04
04
05
05
05
05
06
06
06
07
07
07
08
08
08
08
08
09
09
09
10
10
10
11
11
11
12
98
98
98
99
99

SOTTOCATEGORIA

C1_descrizione
Materiali
Materiali
Confezionamento
Confezionamento
Confezionamento
Acquisti diretti non categorizzati
Servizi generali
Servizi generali
Utilities
Utilities
Utilities
Utilities
Strumenti e parti di ricambio
Strumenti e parti di ricambio
Strumenti e parti di ricambio
Trasporti
Trasporti
Trasporti
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Marketing
Marketing
Marketing
Consulenze e outsourcing
Consulenze e outsourcing
Consulenze e outsourcing
Viaggi di lavoro
Viaggi di lavoro
Viaggi di lavoro
Acquisti indiretti non categorizzati
Spese finanziarie
Spese finanziarie
Spese finanziarie
Dipendenti e spese per il sociale
Dipendenti e spese per il sociale

C2
1
2
1
2
3
0
1
2
1
2
3
4
1
2
3
1
2
3
1
2
3
4
5
1
2
3
1
2
3
1
2
3
0
1
2
3
1
2

C2_descrizione
Materie prime
Semilavorati
Imballaggio primario
Imballaggio secondario
Etichette
Acquisti diretti non categorizzati
Servizi
Manutenzione
Energia elettrica
Gas
Acqua
Altre tipologie di energia
Strumenti
Manutenzione
Parti di ricambio
Costi consegna prodotti
Trasporti a mezzo corriere
Altri costi di trasporto
Hardware IT
Software
Reti
Telecomunicazione
Cancelleria
Merchandising
Pubblicità
Sponsorizzazioni
Consulenti
Servizi in outsourcing
Traduzioni
Alloggio
Trasporto
Rimborsi spese
Acquisti indiretti non categorizzati
Interessi
Servizi bancari
Imposte e tasse
Costo del personale
Donazioni

C12
011
012
021
022
023
030
041
042
051
052
053
054
061
062
063
071
072
073
081
082
083
084
085
091
092
093
101
102
103
111
112
113
120
981
982
983
991
992

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

D/I
Diretti
Diretti
Diretti
Diretti
Diretti
Diretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
N/A
N/A
N/A
N/A
N/A

Ordine/NO
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
1

Per verificare l’esistenza dei
codici riportati in [C12],
possiamo inserire una
colonna nuova, che
chiameremo [C12_check] e
ricercare i codici nella tabella
delle categorie (foglio
“categorie”). La funzione più
adatta per effettuare
quest’operazione è senza
dubbio il cerca verticale
combinato con le funzioni
se e val.errore

2

IL CERCA VERTICALE
Il cerca verticale serve a ricercare un valore all’interno di un elenco di valori. Per un dato valore
X restituisce un valore Y di una colonna della tabella di origine appartenente alla stessa riga di
X
La sintassi
1
2
3
4
=CERCA.VERT(VALORE;TABELLA;INDICE;INTERVALLO)
1) Cella in cui è contenuto il valore da ricercare
2) Il posto dove bisogna ricercare il valore specificato in VALORE
3) Indica il numero di colonne dalla prima della TABELLA, in cui è contenuto il valore da
restituire. II valore da ricercare deve essere collocato per forza nella prima colonna
4) E’ 0 se si vuole che cerchi il valore esatto, 1 se si consente di ricercare per
approssimazioni
Un esempio pratico
Se ricerchiamo il valore 030 nella tabella categorie, e impostiamo il Cerca vert chiedendogli di
resituirci la seconda colonna a partire da C12 (vedi freccia nella tabella categorie in alto), il
risultato sarà “Diretti”.
Indice: il valore è nella colonna F
La formula sarà:
IL VALORE

RESTITUITO
E’ la cella in cui è contenuto
il valore da ricercare

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

Il foglio + l’intervallo in cui c’è la tabella
dove cercare il valore in G18

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
LA FUNZIONE SE – sintassi

LA FUNZIONE VAL.ERRORE
La funzione Val.errore serve ad identificare
gli errori (#N/D, #RIF, etc.) in un database.

Per verificare l’esistenza dei
codici riportati in [C12],
possiamo inserire una
colonna nuova, che
chiameremo [C12_check] e
ricercare i codici nella tabella
delle categorie (foglio
“categorie”). La funzione più
adatta per effettuare
quest’operazione è senza
dubbio il cerca verticale
combinato con le funzioni
se e val.errore

Sintassi
Val.errore(cella)
Da come risultato VERO se il valore
contenuto nella cella è un errore, FALSO
altrimenti.
E’ molto utlizzata in abbinamento a
funzioni di ricerca

1

2

3

SE(CONDIZIONE; SE_VERO; SE_FALSO)
1) E’ un test (ad esempio A1<1; A2=A3)
2) E’ l’istruzione che viene applicata se il test dà
come risultato VERO (ad esempio A1+A2)
2) E’ l’azione da fare se il risultato è FALSO (es.
A1-A2)

USO DEI BLOCCHI
I blocchi $ servono a bloccare i riferimenti di una formula per far sì che questi non
cambino se trasciniamo la formula in altre celle del foglio di lavoro. Per il cerca.vert
di solito viene bloccata la tabella dove viene ricercato il valore (come si vedrà nel
video). Esempi di blocchi:

(clic per video)
Intervallo

Come attivarlo

$A$1:$B$5

Righe e colonne

Selezioniamo nella formula A1:B5 e premiamo sulla
tastiera F4

A$1:B$5

Solo righe

Selezioniamo A1:B5 e premiamo 2 volte F4

$A1:$B5

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

Oggetto del
blocco

Solo colonne

Selezioniamo A1:B5 e premiamo 3 volte F4

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
Per l’analisi delle corrispondenze incrociate, lo strumento migliore è senza dubbio la tabella pivot. Prima di
effettuare l’analisi occorre fare un ragionamento su quali sono nel caso specifico le corrispondenze da
verificare, considerando anche le informazioni che provengono dalla conoscenza del fenomeno studiato.

1) Ci sono delle categorie
per cui gli acquisti
vengono effettuati fuori
ordine (Ordine/NO=0).
Controlliamo se nel
database viene rispettata
questa regola
(clic per video)

MACROCATEGORIA
C1
06
07
07
07
08
08
11
12
98
98
98
99
99

SOTTOCATEGORIA

C1_descrizione
Strumenti e parti di ricambio
Trasporti
Trasporti
Trasporti
Informatica, telecomunicazioni e cancelleria
Informatica, telecomunicazioni e cancelleria
Viaggi di lavoro
Acquisti indiretti non categorizzati
Spese finanziarie
Spese finanziarie
Spese finanziarie
Dipendenti e spese per il sociale
Dipendenti e spese per il sociale

C2
3
1
2
3
1
2
3
0
1
2
3
1
2

C2_descrizione
Parti di ricambio
Costi consegna prodotti
Trasporti a mezzo corriere
Altri costi di trasporto
Hardware IT
Software
Rimborsi spese
Acquisti indiretti non categorizzati
Interessi
Servizi bancari
Imposte e tasse
Costo del personale
Donazioni

C12
063
071
072
073
081
082
113
120
981
982
983
991
992

D/I
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
Indiretti
N/A
N/A
N/A
N/A
N/A

La tabella pivot è una tabella dinamica in cui possiamo inserire i campi appartenenti al
database di origine e creare tabelle di frequenza o semplicemente rappresentare un
fenomeno a 2 dimensioni. E’ simile al filtro, con la differenza che qui possiamo
lavorare incrociando due o più dimensioni contemporaneamente ed ottenere degli
indici di sintesi - conteggio, somma, minimo, massimo, media.
Si compila trascinando i campi (in elenco campi tabella pivot) che ci interessano nello
spazio dedicato.
Gli spazi sono:
• filtro rapporto – per filtrare le informazioni da visualizzare in base al valore/valori di
uno o più campi (come i filtri normali)
• etichette di riga e colonna
• Somma valori – per decidere il campo dei valori da sommare/contare/etc. (ad
esempio possiamo sommare i valori dello Spend o contare il numero di fornitori)

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

Ordine/NO
1
1
0
1
1
1
1
1
0
0
0
0
0
2) Un’informazione derivata dalla
conoscenza della realtà analizzata è che gli
acquisti diretti non possono essere
investimenti (Capex), per cui controlliamo che
ai codici C12 diretti sia sempre associato
Capex=0

Per effettuare il controllo utilizziamo la stessa
procedura mostrata per il punto 1),
selezionando questa volta i codici C12
classificati come “acquisti diretti” nella tabella
categorie. Verifichiamo nella pivot che non ci
siano codici classificati come Capex
(Capex=1), se li troviamo li evidenziamo di
rosso
C12

011
012
021
022
023
030

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

Acquisti Diretti Indiretti

Diretti
Diretti
Diretti
Diretti
Diretti
Diretti

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

Ci sono 12
righe con
codice 030
classificate
come Capex
C. LA VALIDAZIONE – CORREZIONE DEI VALORI
NON VALIDI E IMPUTAZIONE DI QUELLI MANCANTI
Per correggere i valori non validi e imputare i valori mancanti si possono utilizzare diverse
tecniche:


Se riconosciamo errori di digitazione troviamo il valore valido più vicino e li correggiamo di
conseguenza



I valori che non rispettano le regole di corrispondenza incrociata (vedi la tabella
categoria) possono essere corretti sulla base di queste



Se esistono dei valori generici, (es. 030 - acquisti diretti non categorizzati, 120 - acquisti
indiretti non categorizzati) possono essere assegnati ai valori mancanti



I valori mancanti possono essere imputati guardando le righe con valori degli altri campi
simili a quelli della riga in cui è contenuto il mancante



Anche in questo caso si può fare affidamento alla conoscenza diretta del fenomeno



Si può recuperare il documento originario (es. ordine d’acquisto, bolla di consegna, fattura,
etc.), compatibilmente con la sua disponibilità, e verificare il valore direttamente alla fonte

La scelta delle tecniche da utilizzare dipende dal tempo a disposizione, dalla presenza di regole di
validazione e dall’importanza del dato da correggere. Si può anche utilizzare più tecniche insieme

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
Analizziamo con le tecniche descritte, uno alla volta, i campi in cui abbiamo
riscontrato valori non validi.
SITO PRODUTTIVO
Sito produttivo

Filtriamo per colore
rosso

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
IT2f
FR21
FR21
FR21
FR21
FR21
FR21
FR21
FR21
FR21
FR21
FR21

Sito
produttivo_descr
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Milano
Lione
Lione
Lione
Lione
Lione
Lione
Lione
Lione
Lione
Lione
Lione

E’ evidente che i due valori
non validi sono errori di
digitazione. Possiamo
correggerli con il TROVA
SOSTITUISCI
 IT2f si sostituisce con IT2
 FR21 con FR2

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
C12
Bisogna correggere i valori per cui il check aveva dato come risultato “no”. Nella tabella seguente
vengono elencati i valori da correggere, la procedura scelta per la correzione e il valore valido di
sostituzione
Valore

Metodo di correzione

Valore
valido

98

Errore di digitazione: cerchiamo il valore valido più
vicino (nella stessa macrocategoria)

981

120

E’ un problema di formati in quanto il valore
esiste. Possiamo ignorarlo.

#

Scegliamo una regola per i valori mancanti: li
assegnamo alle categorie generiche di acquisti
diretti ed indiretti (assegniamo i Capex agli
indiretti e gli Opex ai diretti)

030 per gli
Opex, 120
per i Capex

010

Errore di digitazione: cerchiamo il valore valido più
vicino (nella stessa macrocategoria)

011

027

Errore di digitazione: cerchiamo il valore valido più
vicino (nella stessa macrocategoria)

023

Nella ricerca del valore sostitutivo possiamo anche considerare
la tipologia di merce venduta dal fornitore associato al valore
errato, utilizzando la nostra conoscenza della realtà analizzata

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

Se mentre procediamo con la
correzione sostituiamo ai valori
errati i valori consentiti e
lasciamo la formula in check
attiva, questa si aggiornerà
contemporaneamente alla
correzione. A correzione
ultimata i “no” dovrebbero
essere sostituiti
completamente dagli “ok”

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
VALIDAZIONI INCROCIATE
Sfruttando la tabella pivot e l’identificatore andiamo a correggere tutte le incompatibilità riscontrate
nella verifica incrociata, con la quale avevamo evidenziato:


i conteggi delle righe che avevano ORDINE/NO=1 con un codice C12 per cui era
consentito solo il valore ORDINE/NO=0



i conteggi delle posizioni di ordine classificate negli acquisti diretti e con flag Capex=1 (un
acquisto diretto non può essere un investimento!!)

Per la sostituzione si possono utilizzare 2 metodi differenti:
a)

Se le righe conteggiate sono poche, le correggiamo utilizzando il comando “mostra dettagli”
(doppio clic sul conteggio dei valori non validi ed modificando il valore direttamente nel
database

b)

Se le righe sono più di 5 utilizziamo il comando “mostra dettagli” per la tabella pivot e
facciamo la correzione con il cerca.vert

Nel prossimo video verranno
applicate entrambe le
metodologie (metodo a per
Capex, metodo b per
ORDINE/NO)

(clic per video)

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

L’inserimento di un campo chiave primaria (ID) è molto
utile quando si lavora con i database. In particolare lo è per
le azioni di ricerca e selezione, in quanto è identificatore
univoco di ciascuna riga. Nel nostro esempio avere l’ID
significa poter automatizzare con una formula (metodo b) la
ricerca dei valori non validi nel database invece che farlo
riga per riga (metodo a)

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
In conclusione, ripercorriamo gli step che abbiamo seguito in questa prima analisi e validazione dei
dati:


Osservazione del database e delle codifiche, se presenti



Formattazione del database per uniformare gli allineamenti e formati



Individuazione delle regole di validazione



Ricerca dei valori non validi



Correzione dei valori non validi e imputazione di quelli mancanti

Le funzionalità di Excel che abbiamo utilizzato sono:


Filtri



Trova-sostituisci



Tabelle pivot (formattazione, mostra dettagli)



Funzioni se(), val.errore() e cerca,vert()

Questo tutorial ha per oggetto dati relativi agli acquisti, ma le metodologie descritte hanno un ambito
di applicazione più generale (vendite, fatturato, spedizioni, etc.) che prescinde dalla natura del dato.
Nel prossimo tutorial il database verrà preparato per la creazione dei report di sintesi

ORGANIZZARE IL
PROPRIO LAVORO
ANALIZZARE

CONTROLLARE E VALIDARE UN DATABASE IN EXCEL

Más contenido relacionado

Destacado

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Destacado (20)

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 

Validare un database in Excel

  • 1. ORGANIZZARE IL PROPRIO LAVORO CONTROLLARE E VALIDARE UN DATABASE IN EXCEL ANALIZZARE TAGS Analizzare dati di speso o fatturato Formattare una tabella Controllare e validare un database Confrontare 2 tabelle Lavorare con i codici, incrociare informazioni provenienti da tabelle differenti Filtri, formattazione, trova-sostituisci funzione cerca vert, funzione if, funzione val.errore, blocchi, tabelle pivot, uso della tastiera
  • 2. In questo tutorial viene affrontato il tema del controllo e validazione di un database in Excel I dati utilizzati, di pura invenzione, sono quelli relativi agli acquisti mensili effettuati da un’azienda manifatturiera X in un determinato anno. Supponiamo che l’azienda abbia 5 siti produttivi ed ipotizziamo che gli acquisti siano suddivisi in:     diretti - materie prime e confezionamento, confluiscono nel prodotto finito indiretti - tutto ciò che invece non vi confluisce, ma che è necessario per la sua produzione CapEx - investimenti, spesa per acquistare beni durevoli OpEx - spese operative di gestione e categorizzati rispetto alla tipologia di merce acquistata (macrocategoria e sottocategoria). I dati di speso sono indicati nella valuta in cui è effettuato l’acquisto. Supponiamo inoltre che il database sia stato scaricato da un gestionale e che presenti delle imprecisioni da correggere. L’obiettivo è ottenere un database pulito, il più possibile aderente alla situazione reale, e prepararlo per la successiva presentazione dei dati. Nel corso del tutorial si affronteranno i problemi che si possono incontrare nello svolgimento di questa tipologia di analisi e si mostrerà come è possibile superarli. La preparazione del database ai fini dell’analisi dati e la creazione di report e grafici di sintesi dei risultati verranno affrontate nei tutorial successivi. ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 3. CAMPI DATABASE ORIGINALE: DESCRIZIONE E VALORI Nome del campo Mese Sito Sito produttivo_ produttivo descr gen-12 feb-12 IT2 Milano mar-12 FR1 Parigi apr-12 FR2 Londra 1 0 giu-12 lug-12 Sulla destra sono riportate le intestazioni delle colonne del database, come sono in partenza, e i valori consentiti ago-12 set-12 I valori assunti da C12 sono riportati nella slide n.8 Valuta Numero ordine Capex Codice a 4 cifre identificativo dell'ordine Flag che vale 1 nel caso in cui l'acquisto sia contabilizzato come un Capex, 0 se Opex ott-12 nov-12 Fornitore Fornitore_desc dic-12 codice a 3 cifre identificativo del fornitore ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Flag che vale 1 per acquisti effettuati con ordine d'acquisto, 0 se effettuati fuori ordine Lione UK1 Ordine/NO Codice a 3 cifre associato alla categoria di merce acquistata Le prime 2 cifre corrispondono alla macrocategoria, l'ultima alla sottocategoria Roma mag-12 Valori ammessi e/o descrizione IT1 C12 Nome del fornitore E' la valuta utilizzata per l'acquisto 1 0 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL Spend in valuta E' il valore monetario dell‘uscita espresso nella valuta della transazione
  • 4. IL DATABASE ORIGINALE: CARATTERISTICHE E STRUTTURA Mese Il database originale è costituito da 5.108 righe ed ogni riga corrisponde ad una riga di ordine o voce di uscita, nel caso di acquisti fuori ordine. Le colonne sono quelle già descritte. Come procediamo per la validazione? ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE nov-12 apr-12 feb-12 mar-12 giu-12 set-12 ott-12 apr-12 apr-12 apr-12 mar-12 mag-12 gen-12 ott-12 mar-12 feb-12 feb-12 nov-12 gen-12 mar-12 mar-12 apr-12 nov-12 apr-12 set-12 nov-12 apr-12 apr-12 apr-12 nov-12 apr-12 Sito Sito produttivo_des produttivo cr UK1 Londra UK1 Londra FR2 Lione FR1 Parigi FR1 Parigi IT2 Milano UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra IT1 Roma FR2 Lione UK1 Londra UK1 Londra FR2 Lione FR2 Lione IT2 Milano IT1 Roma UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra UK1 Londra Numero ordine 7083 5995 2709 2852 2903 5350 6719 5994 5994 5994 5990 4829 2787 6509 5990 2685 2685 5695 4547 5990 5990 5993 7084 5994 6338 7087 5994 6028 6028 6994 5993 Fornitor Fornitore_de e sc 1869 690 1950 1728 1654 399 1143 690 690 690 690 261 1827 999 690 1986 1986 579 237 690 690 690 1869 690 837 1911 690 696 696 1512 690 fornitore545 fornitore152 fornitore572 fornitore498 fornitore472 fornitore55 fornitore303 fornitore152 fornitore152 fornitore152 fornitore152 fornitore9 fornitore531 fornitore255 fornitore152 fornitore584 fornitore584 fornitore115 fornitore1 fornitore152 fornitore152 fornitore152 fornitore545 fornitore152 fornitore201 fornitore559 fornitore152 fornitore154 fornitore154 fornitore426 fornitore152 C12 103 021 # 102 102 011 # 021 021 021 021 010 101 120 021 # # 063 010 021 021 021 011 021 063 121 021 010 010 063 021 Capex 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Ordine/ Valuta NO 01 1 00 00 00 1 11 1 1 1 1 1 00 01 1 00 00 1 1 1 1 1 01 1 1 01 1 1 1 01 1 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL CHF EUR USD EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR EUR USD EUR EUR EUR CHF EUR EUR USD EUR EUR EUR EUR EUR Spend in valuta 1141791,99 891.104,46 806884 546327,83 536998,11 496.000,00 427316 396.781,20 396.781,20 396.781,20 380.198,21 370.400,00 355145,53 335237,76 305.707,61 295182,48 269690,44 249.875,06 236.744,15 230.590,56 230.078,01 215.510,40 208128,33 198.390,60 187.124,00 185176,95 183.143,92 177.972,00 177.972,00 171862,74 169.329,60
  • 5. A. LA PRIMA OSSERVAZIONE DEI DATI Già dalla prima osservazione può emergere la presenza di imprecisioni. In questo caso: 1) disallineamento dei mesi 2) in C12 sono presenti dei codici non assegnati (#) 3) nella colonna Capex ci sono dei numeri memorizzati come valori (in Excel sono allineati automaticamente a destra) ed altri come testo (allineati a sinistra) 4) nel campo Spend in valuta in alcune righe c’è il separatore, in altre no Correggiamo le imprecisioni. (clic per video) ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Sito Sito produttivo produttivo _descr nov-12 UK1 Londra apr-12 UK1 Londra feb-12 FR2 Lione mar-12 FR1 Parigi giu-12 FR1 Parigi set-12 IT2 Milano ott-12 UK1 Londra apr-12 UK1 Londra apr-12 UK1 Londra 1) apr-12 UK1 Londra mar-12 UK1 Londra mag-12 IT1 Roma gen-12 FR2 Lione ott-12 UK1 Londra mar-12 UK1 Londra feb-12 FR2 Lione feb-12 FR2 Lione nov-12 IT2 Milano gen-12 IT1 Roma mar-12 UK1 Londra mar-12 UK1 Londra apr-12 UK1 Londra nov-12 UK1 Londra apr-12 UK1 Londra set-12 UK1 Londra nov-12 UK1 Londra apr-12 UK1 Londra apr-12 UK1 Londra apr-12 UK1 Londra nov-12 UK1 Londra apr-12 UK1 Londra Mese Numero ordine Fornitore Fornitore_desc 7083 5995 2709 2852 2903 5350 6719 5994 5994 5994 5990 4829 2787 6509 5990 2685 2685 5695 4547 5990 5990 5993 7084 5994 6338 7087 5994 6028 6028 6994 5993 1869 690 1950 1728 1654 399 1143 690 690 690 690 261 1827 999 690 1986 1986 579 237 690 690 690 1869 690 837 1911 690 696 696 1512 690 C12 fornitore545 103 fornitore152 021 3) Testo fornitore572 # fornitore498 102 fornitore472 102 3) Valore fornitore55 011 fornitore303 # fornitore152 021 fornitore152 021 fornitore152 021 fornitore152 021 fornitore9 010 fornitore531 101 fornitore255 2) 120 fornitore152 021 fornitore584 # fornitore584 # fornitore115 063 fornitore1 010 fornitore152 021 fornitore152 021 fornitore152 021 fornitore545 011 fornitore152 021 fornitore201 063 fornitore559 121 fornitore152 021 fornitore154 010 fornitore154 010 fornitore426 063 fornitore152 021 Capex 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Ordine/ Valuta NO 01 1 00 00 00 1 11 1 1 1 1 1 00 01 1 00 00 1 1 1 1 1 01 1 1 01 1 1 1 01 1 4) CONTROLLARE E VALIDARE UN DATABASE IN EXCEL Spend in valuta CHF 1141791,99 EUR 891.104,46 USD 806884 EUR 546327,83 EUR 536998,11 Con separatore EUR 496.000,00 EUR 427316 EUR 396.781,20 EUR 396.781,20 EUR 396.781,20 4) EUR Senza 380.198,21 separatore EUR 370.400,00 EUR 355145,53 EUR 335237,76 EUR 305.707,61 EUR 295182,48 EUR 269690,44 EUR 249.875,06 USD 236.744,15 EUR 230.590,56 EUR 230.078,01 EUR 215.510,40 CHF 208128,33 EUR 198.390,60 EUR 187.124,00 USD 185176,95 EUR 183.143,92 EUR 177.972,00 EUR 177.972,00 EUR 171862,74 EUR 169.329,60
  • 6. B. LA VALIDAZIONE - INDIVIDUAZIONE DEI VALORI NON VALIDI O MANCANTI A questo punto possiamo procedere con la validazione dei dati. Il primo passo consiste nell’ individuare delle REGOLE DI VALIDAZIONE. Per identificare le regole:  verifichiamo quali sono i valori validi per ciascun campo del database  analizziamo le corrispondenze incrociate, cioè i valori che possono (e che non possono) essere assunti contemporaneamente da 2 o più campi sulla stessa riga Un metodo che funziona è quello di costruire uno specchietto per i valori ammissibili e le corrispondenze incrociate, a cui far riferimento nella fase di identificazione e correzione degli errori. Spesso si ha già a disposizione queste informazioni. In questo caso utilizzeremo la codifica delle variabili e la tabella delle categorie merceologiche.  si può fare riferimento alle informazioni che derivano dalla conoscenza della realtà analizzata ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 7. Questi sono i valori validi per ciascun campo. Se troviamo dei valori diversi da questi, dobbiamo correggerli Per il controllo, se i valori validi sono pochi (meno di 20/25), si possono utilizzare agevolmente i filtri. In questo caso sfrutteremo questa tecnica per la verifica di mese e sito produttivo. Se troviamo dei valori non validi o mancanti li evidenziamo. (clic per video) ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE I filtri servono ad ordinare e filtrare i dati di una colonna. Si attivano selezionando [ordina e filtra -> filtro] nella barra multifunzione home. Sono dinamici, nel senso che se filtriamo una colonna Excel automaticamente filtrerà tutte le colonne adiacenti (riconosciute dal programma come appartenenti alla stessa tabella) e se clicchiamo sulla freccina mostrerà nella tendina tutti i valori presenti nella colonna in ordine crescente (sia per numeri che per stringhe di testo). Se c’è un filtro attivo, il numero di riga sulla destra è blu. Per visualizzare tutte le righe della tabella quando c’è un filtro attivo ma senza rimuovere il filtro selezionare [cancella] nel menù Ordina e filtra CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 8. MACROCATEGORIA A destra la tabella riportante le categorie merceologiche d’acquisto. MACROCATEGORIA E’ la categoria di livello superiore SOTTOCATEGORIA E’ sempre associata alla macrocategoria a cui appartiene C12 E’ il codice completo, costituito dall’unione di macrocategoria e sottocategoria Es. per “Materie prime” è C1 01 C2 1 C12 011 D/I Classificazione in acquisti diretti, indiretti o non applicabile Ordine/NO 1 per merci acquistate con ordine d’acquisto, 0 per Spend fuori ordine ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE C1 01 01 02 02 02 03 04 04 05 05 05 05 06 06 06 07 07 07 08 08 08 08 08 09 09 09 10 10 10 11 11 11 12 98 98 98 99 99 SOTTOCATEGORIA C1_descrizione Materiali Materiali Confezionamento Confezionamento Confezionamento Acquisti diretti non categorizzati Servizi generali Servizi generali Utilities Utilities Utilities Utilities Strumenti e parti di ricambio Strumenti e parti di ricambio Strumenti e parti di ricambio Trasporti Trasporti Trasporti Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Marketing Marketing Marketing Consulenze e outsourcing Consulenze e outsourcing Consulenze e outsourcing Viaggi di lavoro Viaggi di lavoro Viaggi di lavoro Acquisti indiretti non categorizzati Spese finanziarie Spese finanziarie Spese finanziarie Dipendenti e spese per il sociale Dipendenti e spese per il sociale C2 1 2 1 2 3 0 1 2 1 2 3 4 1 2 3 1 2 3 1 2 3 4 5 1 2 3 1 2 3 1 2 3 0 1 2 3 1 2 C2_descrizione Materie prime Semilavorati Imballaggio primario Imballaggio secondario Etichette Acquisti diretti non categorizzati Servizi Manutenzione Energia elettrica Gas Acqua Altre tipologie di energia Strumenti Manutenzione Parti di ricambio Costi consegna prodotti Trasporti a mezzo corriere Altri costi di trasporto Hardware IT Software Reti Telecomunicazione Cancelleria Merchandising Pubblicità Sponsorizzazioni Consulenti Servizi in outsourcing Traduzioni Alloggio Trasporto Rimborsi spese Acquisti indiretti non categorizzati Interessi Servizi bancari Imposte e tasse Costo del personale Donazioni C12 011 012 021 022 023 030 041 042 051 052 053 054 061 062 063 071 072 073 081 082 083 084 085 091 092 093 101 102 103 111 112 113 120 981 982 983 991 992 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL D/I Diretti Diretti Diretti Diretti Diretti Diretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti N/A N/A N/A N/A N/A Ordine/NO 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0
  • 9. 1 Per verificare l’esistenza dei codici riportati in [C12], possiamo inserire una colonna nuova, che chiameremo [C12_check] e ricercare i codici nella tabella delle categorie (foglio “categorie”). La funzione più adatta per effettuare quest’operazione è senza dubbio il cerca verticale combinato con le funzioni se e val.errore 2 IL CERCA VERTICALE Il cerca verticale serve a ricercare un valore all’interno di un elenco di valori. Per un dato valore X restituisce un valore Y di una colonna della tabella di origine appartenente alla stessa riga di X La sintassi 1 2 3 4 =CERCA.VERT(VALORE;TABELLA;INDICE;INTERVALLO) 1) Cella in cui è contenuto il valore da ricercare 2) Il posto dove bisogna ricercare il valore specificato in VALORE 3) Indica il numero di colonne dalla prima della TABELLA, in cui è contenuto il valore da restituire. II valore da ricercare deve essere collocato per forza nella prima colonna 4) E’ 0 se si vuole che cerchi il valore esatto, 1 se si consente di ricercare per approssimazioni Un esempio pratico Se ricerchiamo il valore 030 nella tabella categorie, e impostiamo il Cerca vert chiedendogli di resituirci la seconda colonna a partire da C12 (vedi freccia nella tabella categorie in alto), il risultato sarà “Diretti”. Indice: il valore è nella colonna F La formula sarà: IL VALORE RESTITUITO E’ la cella in cui è contenuto il valore da ricercare ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Il foglio + l’intervallo in cui c’è la tabella dove cercare il valore in G18 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 10. LA FUNZIONE SE – sintassi LA FUNZIONE VAL.ERRORE La funzione Val.errore serve ad identificare gli errori (#N/D, #RIF, etc.) in un database. Per verificare l’esistenza dei codici riportati in [C12], possiamo inserire una colonna nuova, che chiameremo [C12_check] e ricercare i codici nella tabella delle categorie (foglio “categorie”). La funzione più adatta per effettuare quest’operazione è senza dubbio il cerca verticale combinato con le funzioni se e val.errore Sintassi Val.errore(cella) Da come risultato VERO se il valore contenuto nella cella è un errore, FALSO altrimenti. E’ molto utlizzata in abbinamento a funzioni di ricerca 1 2 3 SE(CONDIZIONE; SE_VERO; SE_FALSO) 1) E’ un test (ad esempio A1<1; A2=A3) 2) E’ l’istruzione che viene applicata se il test dà come risultato VERO (ad esempio A1+A2) 2) E’ l’azione da fare se il risultato è FALSO (es. A1-A2) USO DEI BLOCCHI I blocchi $ servono a bloccare i riferimenti di una formula per far sì che questi non cambino se trasciniamo la formula in altre celle del foglio di lavoro. Per il cerca.vert di solito viene bloccata la tabella dove viene ricercato il valore (come si vedrà nel video). Esempi di blocchi: (clic per video) Intervallo Come attivarlo $A$1:$B$5 Righe e colonne Selezioniamo nella formula A1:B5 e premiamo sulla tastiera F4 A$1:B$5 Solo righe Selezioniamo A1:B5 e premiamo 2 volte F4 $A1:$B5 ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Oggetto del blocco Solo colonne Selezioniamo A1:B5 e premiamo 3 volte F4 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 11. Per l’analisi delle corrispondenze incrociate, lo strumento migliore è senza dubbio la tabella pivot. Prima di effettuare l’analisi occorre fare un ragionamento su quali sono nel caso specifico le corrispondenze da verificare, considerando anche le informazioni che provengono dalla conoscenza del fenomeno studiato. 1) Ci sono delle categorie per cui gli acquisti vengono effettuati fuori ordine (Ordine/NO=0). Controlliamo se nel database viene rispettata questa regola (clic per video) MACROCATEGORIA C1 06 07 07 07 08 08 11 12 98 98 98 99 99 SOTTOCATEGORIA C1_descrizione Strumenti e parti di ricambio Trasporti Trasporti Trasporti Informatica, telecomunicazioni e cancelleria Informatica, telecomunicazioni e cancelleria Viaggi di lavoro Acquisti indiretti non categorizzati Spese finanziarie Spese finanziarie Spese finanziarie Dipendenti e spese per il sociale Dipendenti e spese per il sociale C2 3 1 2 3 1 2 3 0 1 2 3 1 2 C2_descrizione Parti di ricambio Costi consegna prodotti Trasporti a mezzo corriere Altri costi di trasporto Hardware IT Software Rimborsi spese Acquisti indiretti non categorizzati Interessi Servizi bancari Imposte e tasse Costo del personale Donazioni C12 063 071 072 073 081 082 113 120 981 982 983 991 992 D/I Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti Indiretti N/A N/A N/A N/A N/A La tabella pivot è una tabella dinamica in cui possiamo inserire i campi appartenenti al database di origine e creare tabelle di frequenza o semplicemente rappresentare un fenomeno a 2 dimensioni. E’ simile al filtro, con la differenza che qui possiamo lavorare incrociando due o più dimensioni contemporaneamente ed ottenere degli indici di sintesi - conteggio, somma, minimo, massimo, media. Si compila trascinando i campi (in elenco campi tabella pivot) che ci interessano nello spazio dedicato. Gli spazi sono: • filtro rapporto – per filtrare le informazioni da visualizzare in base al valore/valori di uno o più campi (come i filtri normali) • etichette di riga e colonna • Somma valori – per decidere il campo dei valori da sommare/contare/etc. (ad esempio possiamo sommare i valori dello Spend o contare il numero di fornitori) ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL Ordine/NO 1 1 0 1 1 1 1 1 0 0 0 0 0
  • 12. 2) Un’informazione derivata dalla conoscenza della realtà analizzata è che gli acquisti diretti non possono essere investimenti (Capex), per cui controlliamo che ai codici C12 diretti sia sempre associato Capex=0 Per effettuare il controllo utilizziamo la stessa procedura mostrata per il punto 1), selezionando questa volta i codici C12 classificati come “acquisti diretti” nella tabella categorie. Verifichiamo nella pivot che non ci siano codici classificati come Capex (Capex=1), se li troviamo li evidenziamo di rosso C12 011 012 021 022 023 030 ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Acquisti Diretti Indiretti Diretti Diretti Diretti Diretti Diretti Diretti CONTROLLARE E VALIDARE UN DATABASE IN EXCEL Ci sono 12 righe con codice 030 classificate come Capex
  • 13. C. LA VALIDAZIONE – CORREZIONE DEI VALORI NON VALIDI E IMPUTAZIONE DI QUELLI MANCANTI Per correggere i valori non validi e imputare i valori mancanti si possono utilizzare diverse tecniche:  Se riconosciamo errori di digitazione troviamo il valore valido più vicino e li correggiamo di conseguenza  I valori che non rispettano le regole di corrispondenza incrociata (vedi la tabella categoria) possono essere corretti sulla base di queste  Se esistono dei valori generici, (es. 030 - acquisti diretti non categorizzati, 120 - acquisti indiretti non categorizzati) possono essere assegnati ai valori mancanti  I valori mancanti possono essere imputati guardando le righe con valori degli altri campi simili a quelli della riga in cui è contenuto il mancante  Anche in questo caso si può fare affidamento alla conoscenza diretta del fenomeno  Si può recuperare il documento originario (es. ordine d’acquisto, bolla di consegna, fattura, etc.), compatibilmente con la sua disponibilità, e verificare il valore direttamente alla fonte La scelta delle tecniche da utilizzare dipende dal tempo a disposizione, dalla presenza di regole di validazione e dall’importanza del dato da correggere. Si può anche utilizzare più tecniche insieme ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 14. Analizziamo con le tecniche descritte, uno alla volta, i campi in cui abbiamo riscontrato valori non validi. SITO PRODUTTIVO Sito produttivo Filtriamo per colore rosso ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f IT2f FR21 FR21 FR21 FR21 FR21 FR21 FR21 FR21 FR21 FR21 FR21 Sito produttivo_descr Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Milano Lione Lione Lione Lione Lione Lione Lione Lione Lione Lione Lione E’ evidente che i due valori non validi sono errori di digitazione. Possiamo correggerli con il TROVA SOSTITUISCI  IT2f si sostituisce con IT2  FR21 con FR2 CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 15. C12 Bisogna correggere i valori per cui il check aveva dato come risultato “no”. Nella tabella seguente vengono elencati i valori da correggere, la procedura scelta per la correzione e il valore valido di sostituzione Valore Metodo di correzione Valore valido 98 Errore di digitazione: cerchiamo il valore valido più vicino (nella stessa macrocategoria) 981 120 E’ un problema di formati in quanto il valore esiste. Possiamo ignorarlo. # Scegliamo una regola per i valori mancanti: li assegnamo alle categorie generiche di acquisti diretti ed indiretti (assegniamo i Capex agli indiretti e gli Opex ai diretti) 030 per gli Opex, 120 per i Capex 010 Errore di digitazione: cerchiamo il valore valido più vicino (nella stessa macrocategoria) 011 027 Errore di digitazione: cerchiamo il valore valido più vicino (nella stessa macrocategoria) 023 Nella ricerca del valore sostitutivo possiamo anche considerare la tipologia di merce venduta dal fornitore associato al valore errato, utilizzando la nostra conoscenza della realtà analizzata ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE Se mentre procediamo con la correzione sostituiamo ai valori errati i valori consentiti e lasciamo la formula in check attiva, questa si aggiornerà contemporaneamente alla correzione. A correzione ultimata i “no” dovrebbero essere sostituiti completamente dagli “ok” CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 16. VALIDAZIONI INCROCIATE Sfruttando la tabella pivot e l’identificatore andiamo a correggere tutte le incompatibilità riscontrate nella verifica incrociata, con la quale avevamo evidenziato:  i conteggi delle righe che avevano ORDINE/NO=1 con un codice C12 per cui era consentito solo il valore ORDINE/NO=0  i conteggi delle posizioni di ordine classificate negli acquisti diretti e con flag Capex=1 (un acquisto diretto non può essere un investimento!!) Per la sostituzione si possono utilizzare 2 metodi differenti: a) Se le righe conteggiate sono poche, le correggiamo utilizzando il comando “mostra dettagli” (doppio clic sul conteggio dei valori non validi ed modificando il valore direttamente nel database b) Se le righe sono più di 5 utilizziamo il comando “mostra dettagli” per la tabella pivot e facciamo la correzione con il cerca.vert Nel prossimo video verranno applicate entrambe le metodologie (metodo a per Capex, metodo b per ORDINE/NO) (clic per video) ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE L’inserimento di un campo chiave primaria (ID) è molto utile quando si lavora con i database. In particolare lo è per le azioni di ricerca e selezione, in quanto è identificatore univoco di ciascuna riga. Nel nostro esempio avere l’ID significa poter automatizzare con una formula (metodo b) la ricerca dei valori non validi nel database invece che farlo riga per riga (metodo a) CONTROLLARE E VALIDARE UN DATABASE IN EXCEL
  • 17. In conclusione, ripercorriamo gli step che abbiamo seguito in questa prima analisi e validazione dei dati:  Osservazione del database e delle codifiche, se presenti  Formattazione del database per uniformare gli allineamenti e formati  Individuazione delle regole di validazione  Ricerca dei valori non validi  Correzione dei valori non validi e imputazione di quelli mancanti Le funzionalità di Excel che abbiamo utilizzato sono:  Filtri  Trova-sostituisci  Tabelle pivot (formattazione, mostra dettagli)  Funzioni se(), val.errore() e cerca,vert() Questo tutorial ha per oggetto dati relativi agli acquisti, ma le metodologie descritte hanno un ambito di applicazione più generale (vendite, fatturato, spedizioni, etc.) che prescinde dalla natura del dato. Nel prossimo tutorial il database verrà preparato per la creazione dei report di sintesi ORGANIZZARE IL PROPRIO LAVORO ANALIZZARE CONTROLLARE E VALIDARE UN DATABASE IN EXCEL