In uno scenario in cui le fonti dati, all'interno e all'esterno dei confini delle organizzazioni, stanno crescendo esponenzialmente sia in quantità che in tipologia, la costruzione di un knowledge graph rappresenta una via interessante per connettere i dati, superando i silos e creando valore per gli utilizzatori finali. Partendo da esperienze sul campo che hanno portato una start-up a lavorare con una azienda più consolidata si esploreranno casi d'uso concreti che vanno da prodotti consolidati a esperienze più innovative nate anche all'interno di team di datascientist.
4. 4
Il contesto & i suoi numeri
CREDIT INFORMATION
Tutelarsi dal rischio di
credito
MARKETING SOLUTIONS
Crescere con nuove
opportunità di business
CREDIT MANAGEMENT
Gestire e recuperare i
crediti in sofferenza
Ricerche Anagrafiche:
110.000
Blocchi di informazione
Erogati:
2.200.000
Chiamate a Servizi
8.500.000
Eventi su Dati
4.500.000
Operazioni su Storage
documentale
6.500.000
Calcoli Rating
300.000
40 milioni di
righe di codice
Services e
Microservices
2.500
2.000 Persone
34.000 Clienti
Ricavi 2015
353 Milioni €
1.100 Server On
premise e 1.000
TB di Storage
IN UN GIORNO IN
CERVED:
5. 5
I nostri “big data
Web Data
Open Data
Dati proprietari
Dato ufficiale non
camerale
Dato ufficiale
camerale
Accuratezza
Complessità
7. 7
Il titolare effettivo
Livello 1
Willy 10%
Livello 3
Willy 24.4%
Livello 4
Willy 34.2%
TITOLARE EFFETTIVO
ALPHA spa
Soc. A (40%)
Soc. B (50%)
Willy (10%)
Soc. A1 (40%)
Soc. A2 (60%)
Soc. B1 (40%)
Soc. B2 (60%)
Willy
(40%)
Duffy
(60%)
Willy
(40%)
Soc. B1.1 (60%)
Soc. B2.1 (50%)
Speedy
(50%)
Willy
(90%)
Bunny
(10%)
Livello 2
Willy 10%
La persona fisica o le persone che, in ultima istanza, possiedano o controllino la società stessa, attraverso il possesso/controllo diretto/ind di
una % delle partecipazioni al capitale sociale o dei diritti di voto in seno a essa pari ad almeno il 25%+1 di partecipazione al capitale sociale
8. 8
Livello Titolare effettivi
1 3.395.074
2 202.500
3 44.432
4 11.256
5 3.350
6 1.144
7 411
8 339
9 97
10 31
11 16
12 10
13 6
14 4
15 2
TOT 3.658.672
Il titolare effettivo /2
• Totale titolari effettivi 3.658.672
• 2.756.00 titolari effettivi distinti calcolati su 2.238.000
aziende
• Circa 150.000 computazioni/ora
• Più di 350.000 notifiche push verso i nostri clienti
(principalmente banche) negli ultimi 6 mesi
• Su grafo occorrono 39 ms per arrivare al 15° livello
(contro i 369 ms su DB relazionale prestazionale per
arrivare solo al 4° livello)
Statistiche 2016
9. 9
221.821
Gli attuali gruppi economici Cerved
ammontato a circa 220 mila unità, con
un aumento del 22% della recall rispetto
al precedente modello.
Il nuovo modello ha migliorato
l’accuratezza di circa il 30% con una
miglior gestione dei cicli di controllo
75%
Capogruppo
persona fisica
25%
Capogrupo
persona giuridica
Gruppi economici Cerved
10. 10
Cerved Knowledge Graph
Produzione di
software non
connesso all'edizione
SPAZIODATI
0,4 mln
25%
10%
CERVED
320 mln 49%
ERRE3 ltd
2.320 mln
ERRE3
99 mln
90%
Socio Esponente Tit.Effettivo Web Link Ateco
25%
CEO
CEO
11. 11
Graph4you
• Società 10 M
• Iscritte 8,1 M
(di cui cessate) 1,9 M
• Non iscritte 1,6
• Estere 350 K
• Persone fisiche 16,4 M
• Indirizzi 4,5 M
• Customer data
• Esponente di.. 15,6 M
• Socio di.. 8 M
• Condivisione immobili 14,7 M
• Residenza in.. 16,7 M
• Titolare effettivo 3,6 M
• Fusioni 100K
Filtri
• Tipologie di nodi
• Profondità connessione
• Tipo di relazione
• Proprietà delle relazioni
NODI
≌ 30 milioni
RELAZIONI
≌ 59 milioni
12. 12
Overview dell’architettura
WEB APP
FRONT - END
SPRING BOOT
LINKURIOUS.JS
BOOTSTRAP
CUSTOM CODE
JASPER REPORT
SPRING BOOT
SPRING
GRAPH DATA
JAVA
Shortest Path
Traversal
REST API
BACK - END
API
Transactional
HTTP APIINGESTION
Graph file
MySQL
20. 23
Present & future in innovation journey
Work in Progress
Similarity Score / Lead generations
Servizi di recommendation e di similarity su clienti in portafoglio, in base a
settori merceologici, dimensioni, locations, et al.
Company Activities Clustering / Activies supply chain map
Creazione di nuovi cluster settoriali in base alle keywords delle aziende da web
/ creazione di nuove filiere di prodotto
Next
Critical Chain (Contagion Risk, Debts Restructuring, Acquisition Strategy)
Modelli di rischio di contagio, analisi della ristrutturazione di debiti, analisi per
strategia di acquisizione.
Next
21. 24
Innovation
Big Data Technologies
Agile
Minimum viable product,
Scrum , Kanban
Data Exploration
To find new value from our data
Spaziodati
Open Innovation Data Visualization
To shine our uniquess