SlideShare una empresa de Scribd logo
1 de 54
Descargar para leer sin conexión
Actuariat & Données
Arthur Charpentier (Université de Rennes 1 & UQàM)
Rencontres de l’Actuariat
Generali, Paris, Mai 2016
http://freakonometrics.hypotheses.org
@freakonometrics 1
Actuariat & Données
Arthur Charpentier (Université de Rennes 1 & UQàM)
Maître de Conférence, Université de Rennes 1
Directeur des Études Data Science pour l’Actuariat, IA
Porteur de la Chaire actinfo (Institut Louis Bachelier)
(anciennement professeur UQàM & ENSAE Paristech
actuaire à Hong Kong, et FFSA, Paris)
PhD en Statistique (KU Leuven), Fellow Institut des Actuaires
MSc Mathématiques Financières (Paris Dauphine) & ENSAE
Éditeur du blog freakonometrics.hypotheses.org
Éditeur de Computational Actuarial Science, CRC Press
@freakonometrics 2
Data - Données
“People use statistics as the drunken man uses lamp
posts - for support rather than illumination”,
Andrew Lang ou pas. Voir aussi Chris Anderson The
End of Theory: The Data Deluge Makes the Scientific
Method Obsolete, 2008
1. Enjeux autour du Big Data
2. Économétrie vs. Machine Learning
3. Données, Modèles & Actuariat
@freakonometrics 3
Partie 1.
Enjeux autour du Big Data
@freakonometrics 4
Aspects historiques autour de la donnée
Stocker des données: Bâton de comptage (tally sticks), depuis le Paleolithique
Les bâtons servait de mémoire stockant des quantités, voire des messages.
@freakonometrics 5
Aspects historiques autour de la donnée
Collecter des données: John Graunt a conduit une analyse de la propagation de
la peste, en Europe, en 1663
@freakonometrics 6
Aspects historiques autour de la donnée
Manipulation des données: Herman Hollerith a créé
une machine mécanographique (Tabulating Machine)
perforant des cartes pour le recensement américain
de 1880, cf 1880 Census,
n =50 million d’américains.
@freakonometrics 7
Aspects historiques autour de la donnée
Échantillon & Sondage:
Élection présidentielle de 1936
Literary Digest Poll, 2.4 millions de lecteurs
A. Landon: 57% vs. F.D. Roosevelt: 43%
George Gallup, échantillon de 50,000 personnes
A. Landon: 44% vs. F.D. Roosevelt: 56%
Résultats réels
A. Landon: 38% vs. F.D. Roosevelt: 62%
Techniques d’échantillonnage, sondage, prévision à partir de petits échantillons
(contre l’exhaustivité des recensements).
@freakonometrics 8
Aspects historiques autour de la donnée
Data Center: Le gouvernement américain a créé le premier data center en 1965,
pour stocker des 175 millions d’empreintes et 742 millions de documents fiscaux.
@freakonometrics 9
Aspects historiques autour de la donnée
@freakonometrics 10
Aspects historiques autour de la donnée
Manipuler des données: Notion de bases de données
relationnelles, développée par Edgar F. Codd
cf Relational Model of Data for Large Shared Data
Banks, Codd (1970)
Les bases sont penséees comme des matrices, avec
des attributs en colonne, et les bases étant liées entre
elles par un attribut commun (clé)
Début des diagrammes relationnels.
@freakonometrics 11
Les deux cultures
‘The Two Cultures’, de Breiman (2001)
• Data Modeling (statistique & économétrie)
• Algorithmic Modeling (algorithmes)
cf discussion Partie 2.
@freakonometrics 12
Et au XXIth siècle...
Début médiatique du Big Data à partir de Nature (2008) avant de toucher des
revues plus orientées business.
Les 3V de Gartner (Volume, Variété, Vélocité), cf Gartner.
@freakonometrics 13
Big Data & Assurance (santé, par exemple)
Exemple: application Google Flu Trend
voir aussi Lazer et al. (2014)
Mais beaucoup plus avec des objets connectés.
@freakonometrics 14
Aspects computationnels
Comprendre le fonctionnement est devenu indispensable
CPU Central Processing Unit, le coeur de la machine
RAM Random Access Memory, la mémoire non-persistante
HD Hard Drive, la mémoire persistante
CPU est rapide (mais de vitesse finie)
RAM est temporaire, rapide mais limitée
HD permanente, lente, et importante
Exemple Lire un fichier de 100Mb ∼ 1.01sec.
Exemple Lire 150 fichiers de 1Mb ∼ 0.9sec.
distinction entre la latence (temps entre la stimulation et la
réponse, e.g. 10ms pour lire le premier bit) et la performance
(nombre d’opérations par seconde, e.g. 100Mb/sec)
merci à David Sibaï sur cette section.
@freakonometrics 15
Aspects computationnels
PC ‘standard’ :
CPU : 4 core, 1ns de latence
RAM : 32 ou 64 Gb, 100ns latence, 20Gb/sec
HD : 1 Tb, 10ms de latence, 100Mo/sec
Parcourir un fichier texte de 2Tb,
en comptant les espaces 2.1012
opérations
Stockage HD, 100Mb/sec ∼ 2.104
sec ∼ 6 heures
La magie n’existe pas, il y a toujours des limites...
Solution possible: paralléliser
@freakonometrics 16
Aspects computationnels
La parallélisation consister à subdivisionner les tâches (map) puis à les aggréger
ensuite (reduce). Cf comptage de mots dans un texte avec MapReduce
@freakonometrics 17
Partie 2.
Économétrie vs. Machine Learning
@freakonometrics 18
Les données en grande dimension (‘Big Data’)
Terminologie de Bühlmann & van de Geer (2011) et Koch (2013). X est une
matrice n × p.
Portnoy (1988) montre que l’estimateur du maximum de vraisemblance est
asymptotiquement Gaussien quand p2
/n → 0, lorsque n, p → ∞. On a des
données massives si p >
√
n.
Le concept de sparcité est basé non pas sur p, mais sur la taille effective
(variables explicatives ‘significatives’). On peut alors envisager le cas p > n.
La grande dimension (en p) peut faire peur à cause de la malédiction de la
dimension, cf Bellman (1957). Le volume de la sphère unité dans Rp
tend vers 0
lorsque p → ∞: l’espace est vide.
@freakonometrics 19
Données et modèles
Quelle histoire raconter à partir des données {(yi, xi)}, cf Freedman (2005)
• l’histoire causale : pour tout x on associe m(x), et on rajoute un bruit ε. Le
but est de retrouver m(·), les résidus étant définis comme la différence entre
y et m(x).
• l’histoire de lois conditionnelles : pour le modèle Gaussien, Y sachant
X = x suit une loi N(m(x), σ2
). m(x) correspond alors à l’espérance
conditionnelle. Aucune hypothèse causale n’est faite ici. Il faut un modèle
probabiliste ici (Ω, F, P), et une loi conditionnelle pour Y |X
• l’histoire exploratoire des données : On a juste des données. On veut
résumer l’information contenue dans les x de manière à être le plus proche
possible de y (i.e. min{ (y, m(x))}) pour une fonction de perte .
Voir discussion dans Varian (2014)
@freakonometrics 20
Économétrie: le modèle linéaire
Modèle linéaire, homoscédastique Gaussien
(Y |X = x) ∼ N(µ(x), σ2
)
• linéaire: E[Y |X = x] = µ(x) = xT
β
• homoscédastique: Var[Y |X = x] = σ2
.
Condition du Premier Ordre XT
[y − Xβ] = 0
et β = (XT
X)−1
XT
y
@freakonometrics 21
Le modèle linéaire généralisé
Loi (conditionnelle, Y |X) dans la famille exponen-
tielle
f(yi|θi, φ) = exp
yiθi − b(θi)
a(φ)
+ c(yi, φ) with θi = h(xT
i β)
i.e.
(Y |X = x) ∼ L(θx, ϕ)
• Modèle linéaire: [Y |X = x] = g−1
(xT
β)
e.g. (Y |X = x) ∼ P(exp[xT
β]).
Ici β vérifie XT
W [y −µ] = 0 (condition du premier
ordre, maximum de vraisemblance) avec W = W (β)
et µ = µ(β).
@freakonometrics 22
Tests et significativité
La variable xk est significative si on rejette le test H0 : βk = 0 contre H1 : βk = 0.
Utilisation du t-test de Student basé sur tk = βk/seβk
,
On calcule la p-value P[|T| > |tk|] avec T ∼ tν (avec souvent ν = p + 1).
En grande dimension, problème du FDR (False Discovery Ratio)
Avec α = 5%, 5% des variables sont faussement significatives
Si p = 100 avec 5 variables (réellement) significatives, on a 5 faux positifs (en
moyenne), i.e. 50% FDR, cf Benjamini & Hochberg (1995).
@freakonometrics 23
Apprentissage statistique (Machine Learning)
Pas de modèle probabiliste, mais une fonction de perte, . On se donne un
ensemble de fonctions M, X → Y, et on pose
m = argmin
m∈M
n
i=1
(yi, m(xi))
La fonction de perte quadratique est appréciée parce que
y = argmin
m∈R
n
i=1
1
n
[yi − m]2
qui donne, dans une version probabiliste E(Y ) = argmin
m∈R
Y − m 2
2
Pour τ ∈ (0, 1), on obtient la régression quantile (cf Koenker (2005))
m = argmin
m∈M0
n
i=1
τ (yi, m(xi)) avec τ (x, y) = |(x − y)(τ − 1x≤y)|
@freakonometrics 24
Boosting & Apprentissage faible (weak)
On cherche à résoudre
m = argmin
m∈M
n
i=1
(yi, m(xi))
qui est un problème complexe dans un espace M de fonctions X → Y général.
On considère une procédure itérative, qui consiste à apprendre de ses erreurs,
m(k)
(·) = m1(·)
∼y
+ m2(·)
∼ε1
+ m3(·)
∼ε2
+ · · · + mk(·)
∼εk−1
= m(k−1)
(·) + mk(·).
@freakonometrics 25
Boosting & Apprentissage faible (weak)
Il est possible de reconnaître une descente de gradient. Pas
f(xk)
f,xk
∼ f(xk−1)
f,xk−1
+ (xk − xk−1)
αk
f(xk−1)
f,xk−1
mais une version duale
fk(x)
fk,x
∼ fk−1(x)
fk−1,x
+ (fk − fk−1)
ak
fk−1, x
où est un gradient, dans un espace fonctionnel. On a alors ici
m(k)
(x) = m(k−1)
(x) + argmin
f∈F
n
i=1
(yi, m(k−1)
(x) + f(x))
où on va choisir un ensemble F relativement simple (faible) de fonctions en
escalier (appelées stumps)
@freakonometrics 26
Boosting & Apprentissage faible (weak)
Classiquement F sont des fonctions en escalier, mais on peut prendre toutes
sortes de fonctions (e.g. des splines linéaires)
On peut ajouter un paramètre d’atténuation (shrinkage) pour apprendre encore
plus lentement, ε1 = y − α · m1(x) avec α ∈ (0, 1), etc.
@freakonometrics 27
Sur-apprentissage & Pénalisation
On résout ici, pour une norme · (reflétant la complexité du modèle)
min
n
i=1
(yi, β0 + xT
β) + λ β = min objectif(β) + pénalité(β) .
cf Ridge. Ces estimateurs ne sont plus sans biais, mais ont un mse plus faible.
Considérons un échantillon i.id. {y1, · · · , yn} suivant N(θ, σ2
), et cherchons un
estimateur proportionnel à y, i.e. θ = αy. α = 1 correspond à l’estimateur du
maximum de vraisemblance. Or
mse[θ] = (α − 1)2
µ2
biais[θ]2
+
α2
σ2
n
Var[θ]
et donc α = µ2
· µ2
+
σ2
n
−1
< 1.
@freakonometrics 28
(β0, β) = argmin
n
i=1
(yi, β0 + xT
β) + λ β ,
correspond au Lagrangien du problème d’optimisation sous contrainte
(β0, β) = argmin
β; β ≤s
n
i=1
(yi, β0 + xT
β)
@freakonometrics 29
LASSO & Modèles sparses
Souvent, p est (très) grand, mais beaucoup de covariables sont juste du bruit,
βj = 0 pour plusieurs j. Soit s le nombre de variables significatives, avec
s << p, cf Hastie, Tibshirani & Wainwright (2015),
s = card{S} où S = {j; βj = 0}
Le vrai modèle est ici y = XT
SβS + ε, avec XT
SXS de plein rang (colonne).
@freakonometrics 30
LASSO & Modèles sparses
Évolution de βλ en fonction de log λ
−10 −9 −8 −7 −6 −5
−0.20−0.15−0.10−0.050.000.050.10
Log Lambda
Coefficients
4 4 4 4 3 1
1
3
4
5
−9 −8 −7 −6 −5 −4
−0.8−0.6−0.4−0.20.0
Log Lambda
Coefficients
4 4 3 2 1 1
1
2
4
5
sur un modèle de fréquence dommage auto (à gauche) et RC auto (à droite).
@freakonometrics 31
In-Sample & Out-Sample
@freakonometrics 32
Overfit, Généralisation & Complexité
Dans une régression polynômiale, la complexité correspond au degré du polynôme
@freakonometrics 33
Paramètres de lissage (thinning) et validation croisée
m[h ]
(x) = β
[x]
0 + β
[x]
1 x avec (β
[x]
0 , β
[x]
1 ) = argmin
(β0,β1)
n
i=1
ω
[x]
h [yi − (β0 + β1xi)]2
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
qq
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qq
q
q
q
q
q
qq
q
qq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
0 2 4 6 8 10
−2−1012
ou h = argmin mse(h) avec mse(h) =
1
n
n
i=1
yi − m
[h]
(i)(xi)
2
@freakonometrics 34
Économétrie vs. Machine Learning
L’aspect Big Data
- n → ∞: loi du 0/1, tout est alors simplifié (soit vrai, soit faux)
- p → ∞: complexité algorithmique, besoin de choisir les variables
Économétrie vs. Machine Learning
- interprétation probabiliste des modèles économétriques
(peut induire en erreur, e.g. p-value)
reste valide dans le cas non-i.id (séries chronologiques, panel, etc)
- machine learning permet d’avoir des modèles prédictifs généralisables
outils algorithmiques, importance du bootstrap, de la validation-croisée, de la
sélection de variable, des nonlinéaritiés et d’effets croisés, etc
@freakonometrics 35
Part 3.
Données, Modèles & Actuariat
@freakonometrics 36
L’arbitrage Privacy-Utility
Au Massachusetts, la Group Insurance Commission (GIC) gère l’assurance santé
de tous les employés d’état, et a obligation de publier des données agrégées
GIC(zip, date of birth, sex, diagnosis, procedure, ...)
Sweeney (2000) a obtenu les registres de votes pour Cambridge, Massachusetts,
VOTER(name, party, ..., zip, date of birth, sex)
William Weld (ancien governeur) habite à Cambridge, et figure dans VOTER
@freakonometrics 37
L’arbitrage Privacy-Utility
• 6 personnes dans VOTER avaient la même date de naissance
• seulement 3 étaient des hommes
• et Weld était le seul avec le zip code
• Sweeney a obtenu l’historique médical de Weld
“87% of Americans are uniquely identified by their zip code, gender and birth
date”, cf Sweeney (2000).
Une base de données est k-anonymisée si l’information relative à une personne ne
peut être distinguée d’au moins k − 1 autre personnes.
@freakonometrics 38
Aucune segmentation
Assuré Assureur
Perte E[S] S − E[S]
Perte moyenne E[S] 0
Variance 0 Var[S]
Information parfaite: Ω observable
Assuré Assureur
Perte E[S|Ω] S − E[S|Ω]
Perte moyenne E[S] 0
Variance Var E[S|Ω] Var S − E[S|Ω]
Var[S] = E Var[S|Ω]
→ assureur
+ Var E[S|Ω]
→ assuré
.
@freakonometrics 39
Information imparfaite: X ⊂ Ω est ob-
servable
Assuré Assureur
Perte E[S|X] S − E[S|X]
Perte moyenne E[S] 0
Variance Var E[S|X] E Var[S|X]
Var[S] = E Var[S|X] + Var E[S|X]
= E Var[S|Ω]
mutualisation
+ E Var E[S|Ω] X
solidarité
→assureur
+ Var E[S|X]
→ assuré
.
@freakonometrics 40
Modèle simple, Ω = {X1, X2}.
Quatre modèles



m0(x1, x2) = E[S]
m1(x1, x2) = E[S|X1 = x1]
m2(x1, x2) = E[S|X2 = x2]
m12(x1, x2) = E[S|X1 = x1, X2 = x2]
@freakonometrics 41
@freakonometrics 42
Marché en concurrence
Règle de choix: les assurés choisissent la prime la moins chère, cccccccccccc
ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc
ccccccccccccc cccccccccccc ccccccccccccc
A B C D E F
787.93 706.97 1032.62 907.64 822.58 603.83
170.04 197.81 285.99 212.71 177.87 265.13
473.15 447.58 343.64 410.76 414.23 425.23
337.98 336.20 468.45 339.33 383.55 672.91
@freakonometrics 43
Marché en concurrence
Règle de choix: les assurés choisissent (au hasard) parmi les trois primes les
moins chères cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc
ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc
A B C D E F
787.93 706.97 1032.62 907.64 822.58 603.83
170.04 197.81 285.99 212.71 177.87 265.13
473.15 447.58 343.64 410.76 414.23 425.23
337.98 336.20 468.45 339.33 383.55 672.91
@freakonometrics 44
Marché en concurrence
Règle de choix: les assurés se voient attribuer (au hasard) un assureur pour
l’année n − 1. L’année n, si leur assureur est parmi les 3 moins chers, il est
retenu, sinon choix au hasard parmi 4.
A B C D E F
787.93 706.97 1032.62 907.64 822.58 603.83
170.04 197.81 285.99 212.71 177.87 265.13
473.15 447.58 343.64 410.76 414.23 425.23
337.98 336.20 468.45 339.33 383.55 672.91
@freakonometrics 45
Parts de marché (règle 2)
q
q
qq
q
q
q
q
q
q
q
q
q
q
qq
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A13 A14
100020003000400050006000
NumberofContracts
@freakonometrics 46
Parts de marché (règle 3)
q
qq
q
q
q
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A13 A14
2000300040005000
NumberofContracts
@freakonometrics 47
Ratio Sinistres / Primes (règle 2)
Ratio du marché ∼ 154%.
q
q
q
q
q
q
q
qq
q
q
q
q
q
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A13 A14
100150200250
LossRatio
@freakonometrics 48
Assureur A2
Pas de segmentation, prime unique
Remarque tous les prix ont été normalisés,
π2 = m2(xi) =
1
n
n
i=1
mj(xi) ∀j
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
Proportion of insured
Proportionoflosses
more risky less risky
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
MarketShare(in%)
0246810
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
LossRatio(in%)
050100150200
@freakonometrics 49
Assureur A1
Modèles GLM, fréquence RC matériel/corporel et coûts matériels
Age coupé en classe [18-30], [30-45], [45-60] et [60+], effets croisés avec occupation
Lissage manuel, SAS et Excel
Actuaire dans une mutuelle (en France)
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
Proportion of insured
Proportionoflosses
more risky less risky
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
MarketShare(in%)
0246810
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
LossRatio(in%)
050100150200
@freakonometrics 50
Assureur A8/A9
Modèles GLM, fréquence et coûts, suppression des graves (>15k)
Interaction âge-genre
Utilisation d’un logiciel commercial de pricing (développé par Actuaris)
Actuaire dans une mutuelle (en France)
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
Proportion of insured
Proportionoflosses
more risky less risky
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
MarketShare(in%)
0246810
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
LossRatio(in%)
050100150200
@freakonometrics 51
Assureur A11
Toutes les variables sauf une, utilisation de deux modèles XGBoost (gradient
boosting)
Correction pour primes négatives (plafonnées)
Programmé en Python par un actuaire dans une compagnie d’assurance (inscrit à
la formation ADS).
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
Proportion of insured
Proportionoflosses
more risky less risky
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
MarketShare(in%)
0246810
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
LossRatio(in%)
050100150200
@freakonometrics 52
Assureur A12
Toutes les variables, utilisation de deux modèles XGBoost (gradient boosting)
Correction pour primes négatives (plafonnées)
Programmé en R par un actuaire dans une compagnie d’assurance en Europe.
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
Proportion of insured
Proportionoflosses
more risky less risky
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
MarketShare(in%)
0246810
A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13
LossRatio(in%)
050100150200
@freakonometrics 53
Conclusion sur le Pricing Game
Market Share (%)
ObservedLossRatio(%)
A1
A2
A3
A4
A5
A6
A7
A8 A9
A10
A11
A12
A13
5 6 7 8 9 10 11
100120140160180200220
@freakonometrics 54

Más contenido relacionado

La actualidad más candente (20)

Slides ensae 3
Slides ensae 3Slides ensae 3
Slides ensae 3
 
Slides ensae 4
Slides ensae 4Slides ensae 4
Slides ensae 4
 
Slides ensae-2016-7
Slides ensae-2016-7Slides ensae-2016-7
Slides ensae-2016-7
 
Rappels stats-2014-part2
Rappels stats-2014-part2Rappels stats-2014-part2
Rappels stats-2014-part2
 
Slides ensae 7
Slides ensae 7Slides ensae 7
Slides ensae 7
 
Slides ensae-2016-4
Slides ensae-2016-4Slides ensae-2016-4
Slides ensae-2016-4
 
Slides ensae-2016-6
Slides ensae-2016-6Slides ensae-2016-6
Slides ensae-2016-6
 
Slides 2040-5
Slides 2040-5Slides 2040-5
Slides 2040-5
 
Slides 2040-4
Slides 2040-4Slides 2040-4
Slides 2040-4
 
Slides 2040-5
Slides 2040-5Slides 2040-5
Slides 2040-5
 
Slide 2040-1-a2013
Slide 2040-1-a2013Slide 2040-1-a2013
Slide 2040-1-a2013
 
Slide 2040-1
Slide 2040-1Slide 2040-1
Slide 2040-1
 
Slides 2040-2-0
Slides 2040-2-0Slides 2040-2-0
Slides 2040-2-0
 
Slides 2040-4
Slides 2040-4Slides 2040-4
Slides 2040-4
 
Slides act6420-e2014-partie-2
Slides act6420-e2014-partie-2Slides act6420-e2014-partie-2
Slides act6420-e2014-partie-2
 
Slides 2040-7-a2013
Slides 2040-7-a2013Slides 2040-7-a2013
Slides 2040-7-a2013
 
Cours econometrie-uqam-st-2-v2
Cours econometrie-uqam-st-2-v2Cours econometrie-uqam-st-2-v2
Cours econometrie-uqam-st-2-v2
 
Slides 2040-3-a2013
Slides 2040-3-a2013Slides 2040-3-a2013
Slides 2040-3-a2013
 
Cours gestion-actifs-r1-part-2b
Cours gestion-actifs-r1-part-2bCours gestion-actifs-r1-part-2b
Cours gestion-actifs-r1-part-2b
 
Cours econometrie-uqam-st-3-v4
Cours econometrie-uqam-st-3-v4Cours econometrie-uqam-st-3-v4
Cours econometrie-uqam-st-3-v4
 

Destacado (10)

Testing for Extreme Volatility Transmission
Testing for Extreme Volatility Transmission Testing for Extreme Volatility Transmission
Testing for Extreme Volatility Transmission
 
Slides ilb
Slides ilbSlides ilb
Slides ilb
 
Natural Disaster Risk Management
Natural Disaster Risk ManagementNatural Disaster Risk Management
Natural Disaster Risk Management
 
Slides Bank England
Slides Bank EnglandSlides Bank England
Slides Bank England
 
Actuarial Pricing Game
Actuarial Pricing GameActuarial Pricing Game
Actuarial Pricing Game
 
Slides erasmus
Slides erasmusSlides erasmus
Slides erasmus
 
Slides maths eco_rennes
Slides maths eco_rennesSlides maths eco_rennes
Slides maths eco_rennes
 
Slides barcelona risk data
Slides barcelona risk dataSlides barcelona risk data
Slides barcelona risk data
 
Digitalisation en Assurance
Digitalisation en AssuranceDigitalisation en Assurance
Digitalisation en Assurance
 
Slides econ-lm
Slides econ-lmSlides econ-lm
Slides econ-lm
 

Similar a Actuariat et Données

APPRENTISSAGE STATISTIQUE
APPRENTISSAGE STATISTIQUEAPPRENTISSAGE STATISTIQUE
APPRENTISSAGE STATISTIQUEAyoub Abraich
 
Intro_DeepLearning.pdf
Intro_DeepLearning.pdfIntro_DeepLearning.pdf
Intro_DeepLearning.pdfAmou5
 
1 entropie-capacite theorie de l'information
1 entropie-capacite theorie de l'information1 entropie-capacite theorie de l'information
1 entropie-capacite theorie de l'informationAbdou Obado
 
Planification séquentielle pour l'estimation de probabilités de défaillance
Planification séquentielle pour l'estimation de probabilités de défaillancePlanification séquentielle pour l'estimation de probabilités de défaillance
Planification séquentielle pour l'estimation de probabilités de défaillanceJulien Bect
 
Théorie de l'information
Théorie de l'informationThéorie de l'information
Théorie de l'informationRichardTerrat1
 
Mathematics for neuroscience - a gentle introduction (in French)
Mathematics for neuroscience - a gentle introduction (in French)Mathematics for neuroscience - a gentle introduction (in French)
Mathematics for neuroscience - a gentle introduction (in French)AlbanLevy
 
Réseaux de neurones à entrées fonctionnelles
Réseaux de neurones à entrées fonctionnellesRéseaux de neurones à entrées fonctionnelles
Réseaux de neurones à entrées fonctionnellestuxette
 
Développement informatique : Algorithmique I : Récursion et arbre
Développement informatique : Algorithmique I : Récursion et arbreDéveloppement informatique : Algorithmique I : Récursion et arbre
Développement informatique : Algorithmique I : Récursion et arbreECAM Brussels Engineering School
 
Aates ch08 lois-a-densite
Aates ch08 lois-a-densiteAates ch08 lois-a-densite
Aates ch08 lois-a-densiteManar Sefiane
 
Equations différentielles, DUT MP, CM1
Equations différentielles, DUT MP, CM1Equations différentielles, DUT MP, CM1
Equations différentielles, DUT MP, CM1Christophe Palermo
 
Chap9 : Systèmes non linéaires
Chap9 : Systèmes non linéairesChap9 : Systèmes non linéaires
Chap9 : Systèmes non linéairesMohammed TAMALI
 
Brisure De Symétrie Et Nombres De Lychrel
Brisure De Symétrie Et Nombres De LychrelBrisure De Symétrie Et Nombres De Lychrel
Brisure De Symétrie Et Nombres De LychrelIOSRjournaljce
 
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...tuxette
 
logistic_regression_ml.pdf
logistic_regression_ml.pdflogistic_regression_ml.pdf
logistic_regression_ml.pdfSidiAbdallah1
 
Planification et analyse d'expériences numériques: approche bayésienne
Planification et analyse d'expériences numériques: approche bayésiennePlanification et analyse d'expériences numériques: approche bayésienne
Planification et analyse d'expériences numériques: approche bayésienneJulien Bect
 

Similar a Actuariat et Données (20)

APPRENTISSAGE STATISTIQUE
APPRENTISSAGE STATISTIQUEAPPRENTISSAGE STATISTIQUE
APPRENTISSAGE STATISTIQUE
 
1Flou.ppt
1Flou.ppt1Flou.ppt
1Flou.ppt
 
1Flou.ppt
1Flou.ppt1Flou.ppt
1Flou.ppt
 
Classifieur d'entropie maximale (MaxEnt)
Classifieur d'entropie maximale (MaxEnt)Classifieur d'entropie maximale (MaxEnt)
Classifieur d'entropie maximale (MaxEnt)
 
Lmfi1
Lmfi1Lmfi1
Lmfi1
 
Intro_DeepLearning.pdf
Intro_DeepLearning.pdfIntro_DeepLearning.pdf
Intro_DeepLearning.pdf
 
1 entropie-capacite theorie de l'information
1 entropie-capacite theorie de l'information1 entropie-capacite theorie de l'information
1 entropie-capacite theorie de l'information
 
Planification séquentielle pour l'estimation de probabilités de défaillance
Planification séquentielle pour l'estimation de probabilités de défaillancePlanification séquentielle pour l'estimation de probabilités de défaillance
Planification séquentielle pour l'estimation de probabilités de défaillance
 
Théorie de l'information
Théorie de l'informationThéorie de l'information
Théorie de l'information
 
Mathematics for neuroscience - a gentle introduction (in French)
Mathematics for neuroscience - a gentle introduction (in French)Mathematics for neuroscience - a gentle introduction (in French)
Mathematics for neuroscience - a gentle introduction (in French)
 
Réseaux de neurones à entrées fonctionnelles
Réseaux de neurones à entrées fonctionnellesRéseaux de neurones à entrées fonctionnelles
Réseaux de neurones à entrées fonctionnelles
 
Développement informatique : Algorithmique I : Récursion et arbre
Développement informatique : Algorithmique I : Récursion et arbreDéveloppement informatique : Algorithmique I : Récursion et arbre
Développement informatique : Algorithmique I : Récursion et arbre
 
Aates ch08 lois-a-densite
Aates ch08 lois-a-densiteAates ch08 lois-a-densite
Aates ch08 lois-a-densite
 
Equations différentielles, DUT MP, CM1
Equations différentielles, DUT MP, CM1Equations différentielles, DUT MP, CM1
Equations différentielles, DUT MP, CM1
 
Mathématiques et Python
Mathématiques et PythonMathématiques et Python
Mathématiques et Python
 
Chap9 : Systèmes non linéaires
Chap9 : Systèmes non linéairesChap9 : Systèmes non linéaires
Chap9 : Systèmes non linéaires
 
Brisure De Symétrie Et Nombres De Lychrel
Brisure De Symétrie Et Nombres De LychrelBrisure De Symétrie Et Nombres De Lychrel
Brisure De Symétrie Et Nombres De Lychrel
 
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
Théorie de l’apprentissage et SVM : présentation rapide et premières idées da...
 
logistic_regression_ml.pdf
logistic_regression_ml.pdflogistic_regression_ml.pdf
logistic_regression_ml.pdf
 
Planification et analyse d'expériences numériques: approche bayésienne
Planification et analyse d'expériences numériques: approche bayésiennePlanification et analyse d'expériences numériques: approche bayésienne
Planification et analyse d'expériences numériques: approche bayésienne
 

Más de Arthur Charpentier (20)

Family History and Life Insurance
Family History and Life InsuranceFamily History and Life Insurance
Family History and Life Insurance
 
ACT6100 introduction
ACT6100 introductionACT6100 introduction
ACT6100 introduction
 
Family History and Life Insurance (UConn actuarial seminar)
Family History and Life Insurance (UConn actuarial seminar)Family History and Life Insurance (UConn actuarial seminar)
Family History and Life Insurance (UConn actuarial seminar)
 
Control epidemics
Control epidemics Control epidemics
Control epidemics
 
STT5100 Automne 2020, introduction
STT5100 Automne 2020, introductionSTT5100 Automne 2020, introduction
STT5100 Automne 2020, introduction
 
Family History and Life Insurance
Family History and Life InsuranceFamily History and Life Insurance
Family History and Life Insurance
 
Machine Learning in Actuarial Science & Insurance
Machine Learning in Actuarial Science & InsuranceMachine Learning in Actuarial Science & Insurance
Machine Learning in Actuarial Science & Insurance
 
Reinforcement Learning in Economics and Finance
Reinforcement Learning in Economics and FinanceReinforcement Learning in Economics and Finance
Reinforcement Learning in Economics and Finance
 
Optimal Control and COVID-19
Optimal Control and COVID-19Optimal Control and COVID-19
Optimal Control and COVID-19
 
Slides OICA 2020
Slides OICA 2020Slides OICA 2020
Slides OICA 2020
 
Lausanne 2019 #3
Lausanne 2019 #3Lausanne 2019 #3
Lausanne 2019 #3
 
Lausanne 2019 #4
Lausanne 2019 #4Lausanne 2019 #4
Lausanne 2019 #4
 
Lausanne 2019 #2
Lausanne 2019 #2Lausanne 2019 #2
Lausanne 2019 #2
 
Lausanne 2019 #1
Lausanne 2019 #1Lausanne 2019 #1
Lausanne 2019 #1
 
Side 2019 #10
Side 2019 #10Side 2019 #10
Side 2019 #10
 
Side 2019 #11
Side 2019 #11Side 2019 #11
Side 2019 #11
 
Side 2019 #12
Side 2019 #12Side 2019 #12
Side 2019 #12
 
Side 2019 #9
Side 2019 #9Side 2019 #9
Side 2019 #9
 
Side 2019 #8
Side 2019 #8Side 2019 #8
Side 2019 #8
 
Side 2019 #7
Side 2019 #7Side 2019 #7
Side 2019 #7
 

Último

La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetJeanYvesMoine
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxikospam0
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Technologia Formation
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Coursebenezerngoran
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfAmgdoulHatim
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...Faga1939
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxhamzagame
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxShinyaHilalYamanaka
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxrajaakiass01
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 

Último (18)

La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Cours
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 

Actuariat et Données

  • 1. Actuariat & Données Arthur Charpentier (Université de Rennes 1 & UQàM) Rencontres de l’Actuariat Generali, Paris, Mai 2016 http://freakonometrics.hypotheses.org @freakonometrics 1
  • 2. Actuariat & Données Arthur Charpentier (Université de Rennes 1 & UQàM) Maître de Conférence, Université de Rennes 1 Directeur des Études Data Science pour l’Actuariat, IA Porteur de la Chaire actinfo (Institut Louis Bachelier) (anciennement professeur UQàM & ENSAE Paristech actuaire à Hong Kong, et FFSA, Paris) PhD en Statistique (KU Leuven), Fellow Institut des Actuaires MSc Mathématiques Financières (Paris Dauphine) & ENSAE Éditeur du blog freakonometrics.hypotheses.org Éditeur de Computational Actuarial Science, CRC Press @freakonometrics 2
  • 3. Data - Données “People use statistics as the drunken man uses lamp posts - for support rather than illumination”, Andrew Lang ou pas. Voir aussi Chris Anderson The End of Theory: The Data Deluge Makes the Scientific Method Obsolete, 2008 1. Enjeux autour du Big Data 2. Économétrie vs. Machine Learning 3. Données, Modèles & Actuariat @freakonometrics 3
  • 4. Partie 1. Enjeux autour du Big Data @freakonometrics 4
  • 5. Aspects historiques autour de la donnée Stocker des données: Bâton de comptage (tally sticks), depuis le Paleolithique Les bâtons servait de mémoire stockant des quantités, voire des messages. @freakonometrics 5
  • 6. Aspects historiques autour de la donnée Collecter des données: John Graunt a conduit une analyse de la propagation de la peste, en Europe, en 1663 @freakonometrics 6
  • 7. Aspects historiques autour de la donnée Manipulation des données: Herman Hollerith a créé une machine mécanographique (Tabulating Machine) perforant des cartes pour le recensement américain de 1880, cf 1880 Census, n =50 million d’américains. @freakonometrics 7
  • 8. Aspects historiques autour de la donnée Échantillon & Sondage: Élection présidentielle de 1936 Literary Digest Poll, 2.4 millions de lecteurs A. Landon: 57% vs. F.D. Roosevelt: 43% George Gallup, échantillon de 50,000 personnes A. Landon: 44% vs. F.D. Roosevelt: 56% Résultats réels A. Landon: 38% vs. F.D. Roosevelt: 62% Techniques d’échantillonnage, sondage, prévision à partir de petits échantillons (contre l’exhaustivité des recensements). @freakonometrics 8
  • 9. Aspects historiques autour de la donnée Data Center: Le gouvernement américain a créé le premier data center en 1965, pour stocker des 175 millions d’empreintes et 742 millions de documents fiscaux. @freakonometrics 9
  • 10. Aspects historiques autour de la donnée @freakonometrics 10
  • 11. Aspects historiques autour de la donnée Manipuler des données: Notion de bases de données relationnelles, développée par Edgar F. Codd cf Relational Model of Data for Large Shared Data Banks, Codd (1970) Les bases sont penséees comme des matrices, avec des attributs en colonne, et les bases étant liées entre elles par un attribut commun (clé) Début des diagrammes relationnels. @freakonometrics 11
  • 12. Les deux cultures ‘The Two Cultures’, de Breiman (2001) • Data Modeling (statistique & économétrie) • Algorithmic Modeling (algorithmes) cf discussion Partie 2. @freakonometrics 12
  • 13. Et au XXIth siècle... Début médiatique du Big Data à partir de Nature (2008) avant de toucher des revues plus orientées business. Les 3V de Gartner (Volume, Variété, Vélocité), cf Gartner. @freakonometrics 13
  • 14. Big Data & Assurance (santé, par exemple) Exemple: application Google Flu Trend voir aussi Lazer et al. (2014) Mais beaucoup plus avec des objets connectés. @freakonometrics 14
  • 15. Aspects computationnels Comprendre le fonctionnement est devenu indispensable CPU Central Processing Unit, le coeur de la machine RAM Random Access Memory, la mémoire non-persistante HD Hard Drive, la mémoire persistante CPU est rapide (mais de vitesse finie) RAM est temporaire, rapide mais limitée HD permanente, lente, et importante Exemple Lire un fichier de 100Mb ∼ 1.01sec. Exemple Lire 150 fichiers de 1Mb ∼ 0.9sec. distinction entre la latence (temps entre la stimulation et la réponse, e.g. 10ms pour lire le premier bit) et la performance (nombre d’opérations par seconde, e.g. 100Mb/sec) merci à David Sibaï sur cette section. @freakonometrics 15
  • 16. Aspects computationnels PC ‘standard’ : CPU : 4 core, 1ns de latence RAM : 32 ou 64 Gb, 100ns latence, 20Gb/sec HD : 1 Tb, 10ms de latence, 100Mo/sec Parcourir un fichier texte de 2Tb, en comptant les espaces 2.1012 opérations Stockage HD, 100Mb/sec ∼ 2.104 sec ∼ 6 heures La magie n’existe pas, il y a toujours des limites... Solution possible: paralléliser @freakonometrics 16
  • 17. Aspects computationnels La parallélisation consister à subdivisionner les tâches (map) puis à les aggréger ensuite (reduce). Cf comptage de mots dans un texte avec MapReduce @freakonometrics 17
  • 18. Partie 2. Économétrie vs. Machine Learning @freakonometrics 18
  • 19. Les données en grande dimension (‘Big Data’) Terminologie de Bühlmann & van de Geer (2011) et Koch (2013). X est une matrice n × p. Portnoy (1988) montre que l’estimateur du maximum de vraisemblance est asymptotiquement Gaussien quand p2 /n → 0, lorsque n, p → ∞. On a des données massives si p > √ n. Le concept de sparcité est basé non pas sur p, mais sur la taille effective (variables explicatives ‘significatives’). On peut alors envisager le cas p > n. La grande dimension (en p) peut faire peur à cause de la malédiction de la dimension, cf Bellman (1957). Le volume de la sphère unité dans Rp tend vers 0 lorsque p → ∞: l’espace est vide. @freakonometrics 19
  • 20. Données et modèles Quelle histoire raconter à partir des données {(yi, xi)}, cf Freedman (2005) • l’histoire causale : pour tout x on associe m(x), et on rajoute un bruit ε. Le but est de retrouver m(·), les résidus étant définis comme la différence entre y et m(x). • l’histoire de lois conditionnelles : pour le modèle Gaussien, Y sachant X = x suit une loi N(m(x), σ2 ). m(x) correspond alors à l’espérance conditionnelle. Aucune hypothèse causale n’est faite ici. Il faut un modèle probabiliste ici (Ω, F, P), et une loi conditionnelle pour Y |X • l’histoire exploratoire des données : On a juste des données. On veut résumer l’information contenue dans les x de manière à être le plus proche possible de y (i.e. min{ (y, m(x))}) pour une fonction de perte . Voir discussion dans Varian (2014) @freakonometrics 20
  • 21. Économétrie: le modèle linéaire Modèle linéaire, homoscédastique Gaussien (Y |X = x) ∼ N(µ(x), σ2 ) • linéaire: E[Y |X = x] = µ(x) = xT β • homoscédastique: Var[Y |X = x] = σ2 . Condition du Premier Ordre XT [y − Xβ] = 0 et β = (XT X)−1 XT y @freakonometrics 21
  • 22. Le modèle linéaire généralisé Loi (conditionnelle, Y |X) dans la famille exponen- tielle f(yi|θi, φ) = exp yiθi − b(θi) a(φ) + c(yi, φ) with θi = h(xT i β) i.e. (Y |X = x) ∼ L(θx, ϕ) • Modèle linéaire: [Y |X = x] = g−1 (xT β) e.g. (Y |X = x) ∼ P(exp[xT β]). Ici β vérifie XT W [y −µ] = 0 (condition du premier ordre, maximum de vraisemblance) avec W = W (β) et µ = µ(β). @freakonometrics 22
  • 23. Tests et significativité La variable xk est significative si on rejette le test H0 : βk = 0 contre H1 : βk = 0. Utilisation du t-test de Student basé sur tk = βk/seβk , On calcule la p-value P[|T| > |tk|] avec T ∼ tν (avec souvent ν = p + 1). En grande dimension, problème du FDR (False Discovery Ratio) Avec α = 5%, 5% des variables sont faussement significatives Si p = 100 avec 5 variables (réellement) significatives, on a 5 faux positifs (en moyenne), i.e. 50% FDR, cf Benjamini & Hochberg (1995). @freakonometrics 23
  • 24. Apprentissage statistique (Machine Learning) Pas de modèle probabiliste, mais une fonction de perte, . On se donne un ensemble de fonctions M, X → Y, et on pose m = argmin m∈M n i=1 (yi, m(xi)) La fonction de perte quadratique est appréciée parce que y = argmin m∈R n i=1 1 n [yi − m]2 qui donne, dans une version probabiliste E(Y ) = argmin m∈R Y − m 2 2 Pour τ ∈ (0, 1), on obtient la régression quantile (cf Koenker (2005)) m = argmin m∈M0 n i=1 τ (yi, m(xi)) avec τ (x, y) = |(x − y)(τ − 1x≤y)| @freakonometrics 24
  • 25. Boosting & Apprentissage faible (weak) On cherche à résoudre m = argmin m∈M n i=1 (yi, m(xi)) qui est un problème complexe dans un espace M de fonctions X → Y général. On considère une procédure itérative, qui consiste à apprendre de ses erreurs, m(k) (·) = m1(·) ∼y + m2(·) ∼ε1 + m3(·) ∼ε2 + · · · + mk(·) ∼εk−1 = m(k−1) (·) + mk(·). @freakonometrics 25
  • 26. Boosting & Apprentissage faible (weak) Il est possible de reconnaître une descente de gradient. Pas f(xk) f,xk ∼ f(xk−1) f,xk−1 + (xk − xk−1) αk f(xk−1) f,xk−1 mais une version duale fk(x) fk,x ∼ fk−1(x) fk−1,x + (fk − fk−1) ak fk−1, x où est un gradient, dans un espace fonctionnel. On a alors ici m(k) (x) = m(k−1) (x) + argmin f∈F n i=1 (yi, m(k−1) (x) + f(x)) où on va choisir un ensemble F relativement simple (faible) de fonctions en escalier (appelées stumps) @freakonometrics 26
  • 27. Boosting & Apprentissage faible (weak) Classiquement F sont des fonctions en escalier, mais on peut prendre toutes sortes de fonctions (e.g. des splines linéaires) On peut ajouter un paramètre d’atténuation (shrinkage) pour apprendre encore plus lentement, ε1 = y − α · m1(x) avec α ∈ (0, 1), etc. @freakonometrics 27
  • 28. Sur-apprentissage & Pénalisation On résout ici, pour une norme · (reflétant la complexité du modèle) min n i=1 (yi, β0 + xT β) + λ β = min objectif(β) + pénalité(β) . cf Ridge. Ces estimateurs ne sont plus sans biais, mais ont un mse plus faible. Considérons un échantillon i.id. {y1, · · · , yn} suivant N(θ, σ2 ), et cherchons un estimateur proportionnel à y, i.e. θ = αy. α = 1 correspond à l’estimateur du maximum de vraisemblance. Or mse[θ] = (α − 1)2 µ2 biais[θ]2 + α2 σ2 n Var[θ] et donc α = µ2 · µ2 + σ2 n −1 < 1. @freakonometrics 28
  • 29. (β0, β) = argmin n i=1 (yi, β0 + xT β) + λ β , correspond au Lagrangien du problème d’optimisation sous contrainte (β0, β) = argmin β; β ≤s n i=1 (yi, β0 + xT β) @freakonometrics 29
  • 30. LASSO & Modèles sparses Souvent, p est (très) grand, mais beaucoup de covariables sont juste du bruit, βj = 0 pour plusieurs j. Soit s le nombre de variables significatives, avec s << p, cf Hastie, Tibshirani & Wainwright (2015), s = card{S} où S = {j; βj = 0} Le vrai modèle est ici y = XT SβS + ε, avec XT SXS de plein rang (colonne). @freakonometrics 30
  • 31. LASSO & Modèles sparses Évolution de βλ en fonction de log λ −10 −9 −8 −7 −6 −5 −0.20−0.15−0.10−0.050.000.050.10 Log Lambda Coefficients 4 4 4 4 3 1 1 3 4 5 −9 −8 −7 −6 −5 −4 −0.8−0.6−0.4−0.20.0 Log Lambda Coefficients 4 4 3 2 1 1 1 2 4 5 sur un modèle de fréquence dommage auto (à gauche) et RC auto (à droite). @freakonometrics 31
  • 33. Overfit, Généralisation & Complexité Dans une régression polynômiale, la complexité correspond au degré du polynôme @freakonometrics 33
  • 34. Paramètres de lissage (thinning) et validation croisée m[h ] (x) = β [x] 0 + β [x] 1 x avec (β [x] 0 , β [x] 1 ) = argmin (β0,β1) n i=1 ω [x] h [yi − (β0 + β1xi)]2 q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q 0 2 4 6 8 10 −2−1012 ou h = argmin mse(h) avec mse(h) = 1 n n i=1 yi − m [h] (i)(xi) 2 @freakonometrics 34
  • 35. Économétrie vs. Machine Learning L’aspect Big Data - n → ∞: loi du 0/1, tout est alors simplifié (soit vrai, soit faux) - p → ∞: complexité algorithmique, besoin de choisir les variables Économétrie vs. Machine Learning - interprétation probabiliste des modèles économétriques (peut induire en erreur, e.g. p-value) reste valide dans le cas non-i.id (séries chronologiques, panel, etc) - machine learning permet d’avoir des modèles prédictifs généralisables outils algorithmiques, importance du bootstrap, de la validation-croisée, de la sélection de variable, des nonlinéaritiés et d’effets croisés, etc @freakonometrics 35
  • 36. Part 3. Données, Modèles & Actuariat @freakonometrics 36
  • 37. L’arbitrage Privacy-Utility Au Massachusetts, la Group Insurance Commission (GIC) gère l’assurance santé de tous les employés d’état, et a obligation de publier des données agrégées GIC(zip, date of birth, sex, diagnosis, procedure, ...) Sweeney (2000) a obtenu les registres de votes pour Cambridge, Massachusetts, VOTER(name, party, ..., zip, date of birth, sex) William Weld (ancien governeur) habite à Cambridge, et figure dans VOTER @freakonometrics 37
  • 38. L’arbitrage Privacy-Utility • 6 personnes dans VOTER avaient la même date de naissance • seulement 3 étaient des hommes • et Weld était le seul avec le zip code • Sweeney a obtenu l’historique médical de Weld “87% of Americans are uniquely identified by their zip code, gender and birth date”, cf Sweeney (2000). Une base de données est k-anonymisée si l’information relative à une personne ne peut être distinguée d’au moins k − 1 autre personnes. @freakonometrics 38
  • 39. Aucune segmentation Assuré Assureur Perte E[S] S − E[S] Perte moyenne E[S] 0 Variance 0 Var[S] Information parfaite: Ω observable Assuré Assureur Perte E[S|Ω] S − E[S|Ω] Perte moyenne E[S] 0 Variance Var E[S|Ω] Var S − E[S|Ω] Var[S] = E Var[S|Ω] → assureur + Var E[S|Ω] → assuré . @freakonometrics 39
  • 40. Information imparfaite: X ⊂ Ω est ob- servable Assuré Assureur Perte E[S|X] S − E[S|X] Perte moyenne E[S] 0 Variance Var E[S|X] E Var[S|X] Var[S] = E Var[S|X] + Var E[S|X] = E Var[S|Ω] mutualisation + E Var E[S|Ω] X solidarité →assureur + Var E[S|X] → assuré . @freakonometrics 40
  • 41. Modèle simple, Ω = {X1, X2}. Quatre modèles    m0(x1, x2) = E[S] m1(x1, x2) = E[S|X1 = x1] m2(x1, x2) = E[S|X2 = x2] m12(x1, x2) = E[S|X1 = x1, X2 = x2] @freakonometrics 41
  • 43. Marché en concurrence Règle de choix: les assurés choisissent la prime la moins chère, cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc A B C D E F 787.93 706.97 1032.62 907.64 822.58 603.83 170.04 197.81 285.99 212.71 177.87 265.13 473.15 447.58 343.64 410.76 414.23 425.23 337.98 336.20 468.45 339.33 383.55 672.91 @freakonometrics 43
  • 44. Marché en concurrence Règle de choix: les assurés choisissent (au hasard) parmi les trois primes les moins chères cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc cccccccccccc ccccccccccccc A B C D E F 787.93 706.97 1032.62 907.64 822.58 603.83 170.04 197.81 285.99 212.71 177.87 265.13 473.15 447.58 343.64 410.76 414.23 425.23 337.98 336.20 468.45 339.33 383.55 672.91 @freakonometrics 44
  • 45. Marché en concurrence Règle de choix: les assurés se voient attribuer (au hasard) un assureur pour l’année n − 1. L’année n, si leur assureur est parmi les 3 moins chers, il est retenu, sinon choix au hasard parmi 4. A B C D E F 787.93 706.97 1032.62 907.64 822.58 603.83 170.04 197.81 285.99 212.71 177.87 265.13 473.15 447.58 343.64 410.76 414.23 425.23 337.98 336.20 468.45 339.33 383.55 672.91 @freakonometrics 45
  • 46. Parts de marché (règle 2) q q qq q q q q q q q q q q qq A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A13 A14 100020003000400050006000 NumberofContracts @freakonometrics 46
  • 47. Parts de marché (règle 3) q qq q q q A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A13 A14 2000300040005000 NumberofContracts @freakonometrics 47
  • 48. Ratio Sinistres / Primes (règle 2) Ratio du marché ∼ 154%. q q q q q q q qq q q q q q A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A13 A14 100150200250 LossRatio @freakonometrics 48
  • 49. Assureur A2 Pas de segmentation, prime unique Remarque tous les prix ont été normalisés, π2 = m2(xi) = 1 n n i=1 mj(xi) ∀j 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 Proportion of insured Proportionoflosses more risky less risky A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 MarketShare(in%) 0246810 A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 LossRatio(in%) 050100150200 @freakonometrics 49
  • 50. Assureur A1 Modèles GLM, fréquence RC matériel/corporel et coûts matériels Age coupé en classe [18-30], [30-45], [45-60] et [60+], effets croisés avec occupation Lissage manuel, SAS et Excel Actuaire dans une mutuelle (en France) 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 Proportion of insured Proportionoflosses more risky less risky A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 MarketShare(in%) 0246810 A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 LossRatio(in%) 050100150200 @freakonometrics 50
  • 51. Assureur A8/A9 Modèles GLM, fréquence et coûts, suppression des graves (>15k) Interaction âge-genre Utilisation d’un logiciel commercial de pricing (développé par Actuaris) Actuaire dans une mutuelle (en France) 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 Proportion of insured Proportionoflosses more risky less risky A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 MarketShare(in%) 0246810 A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 LossRatio(in%) 050100150200 @freakonometrics 51
  • 52. Assureur A11 Toutes les variables sauf une, utilisation de deux modèles XGBoost (gradient boosting) Correction pour primes négatives (plafonnées) Programmé en Python par un actuaire dans une compagnie d’assurance (inscrit à la formation ADS). 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 Proportion of insured Proportionoflosses more risky less risky A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 MarketShare(in%) 0246810 A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 LossRatio(in%) 050100150200 @freakonometrics 52
  • 53. Assureur A12 Toutes les variables, utilisation de deux modèles XGBoost (gradient boosting) Correction pour primes négatives (plafonnées) Programmé en R par un actuaire dans une compagnie d’assurance en Europe. 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 Proportion of insured Proportionoflosses more risky less risky A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 MarketShare(in%) 0246810 A1 A2 A3 A4 A5 A6 A7 A8 A9 A11 A13 LossRatio(in%) 050100150200 @freakonometrics 53
  • 54. Conclusion sur le Pricing Game Market Share (%) ObservedLossRatio(%) A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 5 6 7 8 9 10 11 100120140160180200220 @freakonometrics 54