Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFL

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Cargando en…3
×

Eche un vistazo a continuación

1 de 140 Anuncio

Más Contenido Relacionado

Presentaciones para usted (20)

Similares a Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFL (20)

Anuncio

Más de Raphael Rollier (18)

Más reciente (20)

Anuncio

Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFL

  1. 1. Connected Event Romandie Du Big Data au Smart Data EPFL – Oct 7, 2015
  2. 2. Du Big Data au Smart Data Nicolas Fulpius – Chief Digital Officer EPFL – Oct 7, 2015
  3. 3. L’accélération de la numérisation impacte notre société New Business Models New Ways of Working Customer Experience Business Processes E2E Connectivity Devices ApplicationsInfrastructure Plates-formes Capteurs, Wearables, « Things » Solutions, applis Data Storage & Aggregation, Cloud, Data Center Plates-formes de service, data analytics, APIs La Chaine de Valeur Digitale Les Dimensions de la Digitalisation
  4. 4. En 2017, on s’attend à ce que le M-commerce réalise 516 milliards de dollars de transaction.
  5. 5. Le volume de crowdfunding a sextuplé en 2 ans.
  6. 6. Les MOOCs de l’EPFL ont 100x plus d’inscrits que le campus ne compte d’étudiants. 1M d’inscrits aux MOOCs
  7. 7. 0110100 1100101010011 1010100101000101 00100100101010010101 100011001010101001 Du Big au Smart Data Vers une problématique sociétale et de l’individu Big Data Smart Analytics Smart Data Volume Velocity Volume Velocity Variety Veracity Volume Velocity Variety Veracity Voluntarism
  8. 8. Swisscom comme moteur de la digitalisation en Suisse E2E Connectivity Devices ApplicationsInfrastructure Plates-formes Capteurs, Wearables, « Things » Solutions, applis Data Storage & Aggregation, Cloud, Data Center Plates-formes de service, data analytics, APIs La Chaine de Valeur Digitale New Business Models New Ways of Working Customer Experience Business Processes Les Dimensions de la Digitalisation
  9. 9. Merci de votre attention
  10. 10. Du Big Data au Smart Data Dr. Adrienne Corboud Fumagalli, Vice Présidente EPFL, Innovation et valorisation @EPFL RLC, 7 octobre 2015
  11. 11. Que faire face au déluge ? The Economist, February 27th - March 5th 2010
  12. 12. Le défi de Noé
  13. 13. Noé a fait le choix des catégories Marketing 1.0 Marketing 2.0 L’opinion Les sondages Les attitudes sur le long terme Les marques
  14. 14. Les sciences sociales et le marketing 3.0 Tracer les data Activités et Memes Rapidité davantage que volume et diversité Contexte
  15. 15. L’alliance des médias populaires et du Social Media : un puissant moteur, producteur de données en temps réel
  16. 16. Exemple : détection de tous Les réseaux d’influences • par communautés actives graphe 1 • par controverses graphe 2 • avec les émotions associées graphe 3 • le réseau nuisible à l’intérêt de la marque graphe 4. Une marque sous influence ! Graphe 1 Graphe 2 Graphe 3 Graphe 4 EPFL Social Media Lab
  17. 17. “…everybody here has other much more important business to take care of.” http://youtu.be/-ybecKdwj2c Leaders et opinion publique: le grand fossé Négociations sur le changement climatique (Copenhague)
  18. 18. Le défi de la COP 21 : un débat citoyen • développer une pédagogie à l’intention du public, • assurer transparence et clarté des débats et des positions de négociation EPFL Social Media Lab
  19. 19. Cartographie des sentiments face à la vaccination Prof. Marcel Salathé, EPFL-SV
  20. 20. Les Traces donnent du sens
  21. 21. Merci de votre attention adrienne.corboud@epfl.ch
  22. 22. Recommendation: Le Smart Data pour nous Boi Faltings
  23. 23. Internet et le développement durable • Le tour des magasins devient virtuel • Papier remplacé par Ipad/Kindle • Communautés sur réseaux sociaux 27
  24. 24. Ce n’est pas simple… 28
  25. 25. Recommendations 29
  26. 26. Collaborative Filtering • Big data = matrice des achats: • Gourmande => il faut avoir acheté ≈1% des produits pour trouver des associations fiables. a b c d e f g h i j k l Antoine x x x x Chantal x x x Francois x x x Nicole x x x Pierre x x x x 30
  27. 27. Smart Data • Apprentissage: trouver un modèle à peu de paramètres qui prédit les articles achetés. 31 Achats (peu remplie) U V ≈ x d (traits latents) d Clients Produits Produits Clients
  28. 28. Modèle => Prévisions • Supposons 2 traits latents f1 et f2: a b c d e f g h i j k l f1 1 0 1 1 0 0 1 0 0 0 0 0 f2 0 1 0 0 1 1 0 1 1 1 0 0 f1 f2 Antoine 0 1 Chantal 1 0 Francois 0 1 Nicole 1 0 Pierre 0 1 0 1 0 0 1 1 0 1 1 1 0 0 1 0 1 1 0 0 1 0 0 0 0 0 0 1 0 0 1 1 0 1 1 1 0 0 1 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 1 0 0 32
  29. 29. Big Data • 100’000 produits, 1 million utilisateurs => Matrice: 100 milliards de paramètres. • 20 achats/utilisateur: 20 millions de données. • Modèle à d=5 dimensions latents: 5.5 millions de paramètres: faisable! • Optimiser la prédiction des achats connus. 33
  30. 30. Failles de l’optimisation • Evaluation = précision moyenne: – Article populaire: poids = 1000 achats – Article “long tail”: poids = 2-3 achats • Modèle optimisé pour être correct sur les articles populaires… • …mais pas sur les articles “longue traîne” • recommendation précise, mais pas nouvelle! 34
  31. 31. Apprendre une Taxonomie • N produits => < 2N paramètres • Achats répétés n’ont pas d’influence. 35
  32. 32. Ontology Filtering (Schickel) • Performance au laboratoire, sur Movielens: – Bonne précision déjà avec 5 achats au lieu de 40! • Thèse recomponsé par prix Chorafas. 36
  33. 33. • Tourne sur plus de 40 sites. • Influence sur les ventes par rapport aux systèmes antérieurs: entre + 30 et + 700%. • Grace à une forte composante de recommendations “long tail”. 37
  34. 34. En Conclusion • Smart data = recommendation. • Clé pour l’évolution de l’ecommerce. • Techniques (et performances) très variés. • Attention à l’évaluation: Critère doit correspondre aux objectifs. 38
  35. 35. Information Équilibrée ObViz.com Claudiu Musat Co-foundateur spinoff
  36. 36. ObViz Swisscom & ObViz 40 • Boi Faltings • Maxime Darçot • Gaylor Bosson • Claudiu Musat • Etudiants en Master à l’EPFL • Audrey Loeffel CEO CTO Web& Scalability Interface Board of Directors • Ph.D & postdoc en IA • 7 ans d’expérience dans l’industrie • Prof. EPFL - 30 ans dans la recherche • Serial Entrepreneur – Fondateur de Nexthink et Preddigo • 2 Masters en Computer Science
  37. 37. Personnaliser la recherche Swisscom & ObViz 41
  38. 38. État de l’art dans l’industrie Swisscom & ObViz 42
  39. 39. État de l’art dans la recherche Swisscom & ObViz 43
  40. 40. “Equilibrer” la Visualisation Swisscom & ObViz 44
  41. 41. Décisions facilitées Swisscom & ObViz 45 CONFIANCE PERÇUE (SUBJECTIF) CERTITUDE DE LA DECISION TAUX DE CHANGEMENT (OBJECTIF) INTERFACE PRÉFÉRENCE (SUBJECTIF) CONFIANCE 2.06x2.76x1.53x3.67x2.66x6.49x
  42. 42. Swisscom & ObViz 46 À la découverte !
  43. 43. Swisscom & ObViz 47 Transparence & Confiance
  44. 44. Swisscom & ObViz 48
  45. 45. (Social) Media Monitoring Swisscom & ObViz 49
  46. 46. ObViz team 50 With the ObViz business app you can track your image and products in the media. Be notified about perception changes.
  47. 47. ObViz team Swisscom & ObViz 51 Compréhension & Personnalisation
  48. 48. Swisscom,Folienbibliothek Ville : comment améliorer ma qualité de vie en tant que citoyen-ne ? Raphaël Rollier, Swisscom Alexandre Bosshard, Ville de Pully
  49. 49. … quels outils d’analyses ? ? Monde Internet Monde physique
  50. 50. Observatoire de la mobilité à Pully Visiosafe et son projet à la gare de Lausanne Exemple de deux projets Smart City … au service de la mobilité
  51. 51. Raphael Rollier 09/2015 55 Source: Projet d’agglomération Lausanne-Morges Pully : ville-centre de l’agglomération
  52. 52. Attractivité du centre ville
  53. 53. Raphael Rollier 09/2015
  54. 54. 1er siècle après J-C, villa romaine de Pully En ce temps-là parut un édit de César Auguste, ordonnant un recensement de toute la terre. La Bible
  55. 55. 1969 comptage manuel
  56. 56. 1969 comptage manuel 2015 Boucles de comptage, caméras, mesures manuelles
  57. 57. 1 2 3 4
  58. 58. Enjeux … passer de la photo au film PRECISION CONTINUITE SPATIALE CONTINUITE TEMPORELLE Mobililty Insights
  59. 59. SMART CITY … «Observatoire de la mobilité de Pully» 2016
  60. 60. D’où viennent les gens qui passent à Pully ?
  61. 61. Top 5, Communes 1. Lausanne 2. Lutry 3. Bourg-en-Lavaux 4. Vevey 5. Montreux Top 5, Quartiers de Lausanne 1. Centre-Ville 2. Ouchy 3. Montchoisi 4. Montriond- Cour 5. Sallaz - Vennes
  62. 62. Qui vient à Pully ? Visiteurs Pendulaires Personnes en transit Pully 75% 5% 20% 25’000 trajets
  63. 63. Perspectives
  64. 64. Raphael Rollier 09/2015 70
  65. 65. Raphael Rollier 09/2015
  66. 66. Projet Smart City … prochains résultats présentés le 3 décembre à Zoug
  67. 67. … quels outils d’analyses ? Monde Internet Monde physique
  68. 68. Sensing behavioral facts
  69. 69. Comment les visiteurs se comportent? Compter • Visiteurs #: 246 • Zone / Section 1118 Directions : Entrée / Sortie • Zone #1 : 18 / 11 Durations • Temps de visite • Temps d’attente • Temps de service Distances • Distance Parcourue • Chemin de visiteurs Heat maps • Hot spots • Zone d'intérêt
  70. 70. Fournir des indications quantitatives et analytiques
  71. 71. Comment ça marche ?
  72. 72. Capture de données Entièrement Anonyme Intelligence Artificielle Analyse Visiosafe A.I.
  73. 73. Capture PerceptionAction ApprentissagePublication Visiosafe Intelligence Artificielle
  74. 74. Cas d'utilisation
  75. 75. Terminals in Switzerland TERMINALS
  76. 76. Get quantitative insights on your visitors alain@visiosafe.com www.visiosafe.com
  77. 77. Big Data au Smart data Start-up
  78. 78. Sophia Genetics - Data Driven Medicine Pryv - Sensitive medical information management
  79. 79. Faveeo - Collaborative Intelligence for Web & Social Media Obviz - Big data and social network analysis to extract opinions and meaning
  80. 80. RAW Labs - Revolutionary Database query platform PredictiveLayer - Automated Predictive Analysis
  81. 81. MERCI @innovaud www.innovaud.ch
  82. 82. Sophia DDM – Big Data / Smart Data 07.10.2015 CONFIDENTIAL 92
  83. 83. 07.10.2015 CONFIDENTIAL 93 Personalized Medicine Approche taille unique Approche ciblée Prédictive Pronostic Précision Personnalisation
  84. 84. 07.10.2015 CONFIDENTIAL 94 Qu’est ce qu’un Test Génétique ? Patient Généticien NCBI ExAC COSMIC … Docteurs Sample Lab Preparation DNA Enrichment Sequencing Storage Alignment Algorithms Statistics Variant Annotation Noise Extraction Prédiction likelihood breast cancer Cancers choice of drugs treatment plan Classification DDM Application
  85. 85. Capture 95
  86. 86. Différentes technologies – même échantillon NGS Platform A Sample prep. A B A B A B B 96
  87. 87. 97 ‘Machine Learning’ / Maths Précision Reproductible Robuste Rentable
  88. 88. Mutualize Data plus de complexité -> Précision Securité / Données Privées Impacte à long terme des fuites d’information Réseau – partage entre laboratoires Bénéficier de l’expérience des autres 07.10.2015 CONFIDENTIAL 98 Differentes Hopitaux: Big Data –> Clinical Diagnostics
  89. 89. Information d’un patient aujourd’hui Bénéficie à tous les patients demain Intégration du savoir Premier diagnostic Autre information Information génomique Du big au Smart data 99
  90. 90. 07/10/2015 CONFIDENTIAL 100 Diagnostiques - Du big au Smart data >20,000 patients aidés en 2015 Genomic Information Other Medical Information +
  91. 91. Ioannis Xenarios SIB Swiss Institute of Bioinformatics Vital-IT and Swiss-Prot group
  92. 92. SIB Swiss Institute of Bioinformatics 2015 56 groups 700 scientists More than 400 between Lausanne and Geneva
  93. 93. SIB Swiss Institute of Bioinformatics 2015 56 groups 700 scientists
  94. 94. SIB missions • To provide core databases, software and services worldwide • To provide key competencies and research support To provide world- class core bioinformatics resources to the life science community • To federate Swiss bioinformatics researchers • To train first-rate researchers To lead and coordinate the field of bioinformatics in Switzerland
  95. 95. To provide core databases, software and services worldwide • World-renowned encyclopedia of protein sequences and functional information • > 540,000 curated protein sequences • ~ 220,000 curated literature references • ~ 800,000 visits per month • A central hub linking to over 140 other resources worldwide • A team of over 50 biocurators, developers, IT and support staff Enabling Big Data - the Swiss-Prot group
  96. 96. 4000 years of evolution of biocuration, Structuring knowledge
  97. 97. Challenge 1: knowledge representation genes and genomes proteins complexes chemicals reactions pathways systems UniPathway
  98. 98. ● In databases ● The level of erroneous annotation is higher in automatically annotated databases than in manually expert curated ones ● In literature ● Not every published findings is latter confirmed independently ... Challenge 2: Errors, Mistakes, Imprecisions
  99. 99. Swiss-Prot people Ioannis Xenarios Director Alan BridgeLydie Bougueleret Sylvain Poux Nicole Redaschi Operation Director Head of Curation Head of Automation Head of Development Ioannis Xenarios
  100. 100. The Vital-IT group (Lausanne) To provide key competencies & research support to the national life science community
  101. 101. Vital-IT: A “cloud” HPC • > 6’000 cores • >1’400 software maintained as RPM release • > 6 PB near-line/archive data An infrastructure distributed over western Switzerland The infrastructure is centrally managed from Lausanne
  102. 102. Vital-IT supports the technology plateforms • Technology platforms are located in the the different universities, at the EPFL • Genomics (sequencing) • Proteomics • Screening and imaging • Bioinformatics "core" facilities • Biostatistics • Data growth (raw unprocessed) • from 1TB/week (2007) • to >32 TB /week (2014) • 42 TB/week Q1 2015 Need to archive >10-25 years
  103. 103. Vital-IT infrastructure And Competence Platforms of Ecole polytechnique Fédérale de Lausanne Platforms of University of Lausanne LGTF1,PAF2,PMF3,BCF4, PMF5 Platforms of University of Fribourg NGS1,BugFri4 Platforms of Bern NGS1,IFBU4 PCF2,BSF3,BBCF4 Platforms of Geneva University iGE3-genomics (ex-NCCR genome)1, PCF/BPRG2 Platforms specificities 1: Genomics 2: Proteomics 3: Screening and imaging 4:Bioinformatics Core facilities 5: Protein Modeling Facility
  104. 104. People at Vital-IT Christian Iseli Marco Pagni Mark IbbersonNicolas Guex Brian Stevenson HPC OncoGenomics Personalized Genomes Metagenomics Metabolic Models Evidence-based BioMedecine Computational Systems Biology Roberto Fabbretti Jérôme DauvillierRobin Liechti hardware software development data analysis Computational Genomics Scientific vizualisation Neuro-genomics
  105. 105. Repertoire of (longitudinal) ‘omics data available Proteome Transcriptome (mRNA, isoforms, edits, miRNA, lincRNA, …) Cytokines Metabolome Genome & Epigenome Microbiome Viriome EMR / EHR PERSONAL DATA « PRECISION » MEDICINE Antibody-ome Environment (exposome) Etc’ome nutriome • Improve biological and medical knowledge • Improve disease definition • Discovery diagnostic markers • Discovery prognostic markers • Understanding early pathophysiology • Disease stratification • Patient stratification • New therapeutic leads • Adapt therapies to the above Slide from the Clinical Bioinformatics Head Jacqui Beckmann (SIB)
  106. 106. Private and Public partners are essential sources of funding
  107. 107. EvénementConnect Lausanne, EPFL, 7 octobre 2015 Du Big Data au Smart Data Etat des lieux, nouveaux défis MichelJaccard
  108. 108. 119Protection des donnees – la loi actuelle
  109. 109. 120Protection des donnees – la loi actuelle
  110. 110. 121Protection des donnees – les principes de base données personnelles traitement maître de fichier motif justificatif consentement niveau de protection équivalent à l’étranger
  111. 111. 122Protection des donnees – Nouveaux defis données personnelles traitement maître de fichier motif justificatif consentement niveau de protection équivalent Croissance exponentielle Caractère personnel (permanent) ?
  112. 112. 123Protection des donnees – Nouveaux defis données personnelles traitement maître de fichier motif justificatif consentement niveau de protection équivalent Hébergement ? Stockage dans le cloud ? Indexation ? Chiffrement ?
  113. 113. 124Protection des donnees – Nouveaux defis données personnelles traitement maître de fichier motif justificatif consentement niveau de protection équivalent Pas qu’un seul «maître», Pas qu’un seul fichier
  114. 114. 125Protection des donnees – Nouveaux defis données personnelles traitement maître de fichier motif justificatif consentement niveau de protection équivalent Aucun traitement ne peut-il vraiment être justifié par principe ?
  115. 115. 126Protection des donnees – Nouveaux defis données personnelles traitement maître de fichier motif justificatif consentement niveau de protection équivalent Caractère artificiel du consentement donné (en ligne) Absence de précision sur la finalité | les utilisations futures
  116. 116. 127Protection des donnees – Nouveaux defis données personnelles traitement maître de fichier motif justificatif consentement niveau de protection équivalent Appréciation politique, sociale, culturelle Analyse au cas par cas nécessaire (dans les faits), pas de blanc seing par pays (Safe Harbor !)
  117. 117. 128Protection des donnees – Nouveaux defis Droit à l’oubli ?
  118. 118. 129Protection des donnees – Nouveaux defis Cybersécurité ?
  119. 119. 130Protection des donnees – Nouveaux defis Surveillance ?
  120. 120. 131 Données personnelles ? Pas nécessairement… Protection des donnees – big data
  121. 121. 132 Données fiables (et utiles) ? Pas forcément… Protection des donnees – big data
  122. 122. 133 Données personnelles ? Probablement, par analyses (anonymes ?) et recoupements… Protection des donnees – SMART DATA
  123. 123. 134Protection des donnees – big data | SMART DATA Données personnelles, par moments – Comment régler la question de l’assujettissement à la réglementation ? Et qui joue le rôle du «maître du fichier» ? Comment s’assurer d’un consentement véritable sans connaître la finalité du traitement au moment de la collecte des données, puisqu’elle dépendra des analyses | recoupements? Comment assurer le droit d’accès à des fractions de données éparpillées, sachant que celui qui compile les bases de données ou les met à disposition n’est pas forcément celui qui procède aux analyses | recoupements ?
  124. 124. 135Protection des donnees – big data | SMART DATA Evolution ? Consentement présumé pour toute utilisation des données qui serait «reconnaissable» au moment de leur collecte Certification par des tiers (de confiance ?) Renforcement des sanctions
  125. 125. 136Protection des donnees – big data | SMART DATA
  126. 126. 137Protection des donnees – big data | SMART DATA Big Bang ? Sécurisation des données, indépendamment de leur caractère personnel ou non «opting out» généralisé Données sensibles avec devoirs spécifiques (santé ? géolocalisation ?) Renforcement des droits de la personnalité
  127. 127. 138Protection des donnees – big data | SMART DATA Solutions technologiques «Privacy by design» «Privacy by default» Atout majeur pour les sociétés suisses
  128. 128. 139 MICHEL JACCARD id est avocats Email Michel.Jaccard@idest.pro | Michel.Jaccard@protonmail.ch URL www.idest.pro Twitter @idestavocats Questions
  129. 129. 140 Merci pour votre visite!

×