XebiCon'18 - Spark NLP, un an après

•

0 recomendaciones•4,701 vistas

Spark NLP (Natural Language Processing) permet depuis son lancement en open source, il y a un an et quelques mois, d'avoir une solution de traitement du langage directement développé pour Apache Spark et Spark ML (Machine Learning). Apache Spark avec son module ML permet de lancer des tâches de data science, avec du machine learning et du deep learning, tout en profitant de l'aspect distribué de son architecture. Avec Spark NLP, on peut le faire maintenant avec des tâches de NLP spécialisé. Depuis sa sortie, que peux-t-on faire avec Spark NLP ? Quels cas sont à tester avec Spark NLP, et ceux à éviter ? Est-ce facile pour les équipes d'entraîner un modèle et de l'utiliser dans son pipeline ? Nous verrons ces questions à travers un exemple rapide d'entraînement de détection d'entités nommées (NER) avec Spark NLP. Par Aurore De Amaral, Data Engineer chez Xebia Toutes les informations sur xebicon.fr

Tecnología

@Xebiconfr #Xebicon18 @auroredea
Spark NLP, 1 an après
Aurore de Amaral, Ingénieur Data
1

@Xebiconfr #Xebicon18 @auroredea
Aurore de Amaral
Ingénieur Data
(passionnée par le TAL :D)
2

@Xebiconfr #Xebicon18 @auroredea
Dernière version : 1.7.3
Utilise Spark/Spark ML 2.X.X
Scala 2.11.X
Java 7+
Développé et Open Sourcé depuis 1 an par :
5

@Xebiconfr #Xebicon18 @auroredea 8
Corpus annoté sur https://github.com/YoannDupont/WiNER-fr
À l’extérieur, d’autres élus comme Philippe Goujon , député-maire Les Républicains du 15 e arrondissement
de Paris , et Frédéric Lefebvre , député LR, tentaient de faire barrage. Ce dernier en appelle au Pape
François « pour sauvegarder ce lieu de culte » [1] .

@Xebiconfr #Xebicon18 @auroredea 11
Phrases Tokenizer POS
Maître Corbeau, ... [“Maître”, “Corbeau”, ”,”] [“Maître”,”N”], [“Corbeau”,”N”]
Maître Renard, ... [“Maître”, “Renard”, ”,” ] [“Maître”,”N”], [“Renard”,”N”]

@Xebiconfr #Xebicon18 @auroredea
Pré-entraîné sur l’anglais Pas de pré-entraînement
BasicPipeline Pipeline
AdvancedPipeline LightPipeline
SentimentPipeline RecursivePipeline
12

Más contenido relacionado

Más de Publicis Sapient Engineering

XebiCon'18 - Boostez vos modèles avec du Deep Learning distribuéPublicis Sapient Engineering

XebiCon'18 - Comment j'ai développé un jeu vidéo avec des outils de développe...Publicis Sapient Engineering

XebiCon'18 - Les utilisateurs finaux, les oubliés de nos produits !Publicis Sapient Engineering

XebiCon'18 - Comment fausser l'interprétation de vos résultats avec des datavizPublicis Sapient Engineering

XebiCon'18 - Le développeur dans la Pop Culture Publicis Sapient Engineering

XebiCon'18 - Architecturer son application mobile pour la durabilitéPublicis Sapient Engineering

XebiCon'18 - Sécuriser son API avec OpenID ConnectPublicis Sapient Engineering

XebiCon'18 - Structuration du Temps et Dynamique de Groupes, Théorie organisa...Publicis Sapient Engineering

XebiCon'18 - La sécurité, douce illusion même en 2018Publicis Sapient Engineering

XebiCon'18 - Utiliser Hyperledger Fabric pour la création d'une blockchain pr...Publicis Sapient Engineering

XebiCon'18 - Ce que l'histoire du métro Parisien m'a enseigné sur la création...Publicis Sapient Engineering

XebiCon'18 - La guerre des Frameworks n'aura pas lieuPublicis Sapient Engineering

XebiCon'18 - Orchestration : Conteneurs vs MusiquePublicis Sapient Engineering

XebiCon'18 - Passage à l'échelle de mes applications Kafka-StreamsPublicis Sapient Engineering

XebiCon'18 - Data Science Done WrongPublicis Sapient Engineering

TEch4Exec - OUI.sncf propose des voyages moins chers grâce au Big Data et au ...Publicis Sapient Engineering

Tech4Exec - Pourquoi faut-il gérer votre projet (Big) data comme une start-up...Publicis Sapient Engineering

Tech4Exec - Etat de l’art et vulgarisation du Machine LearningPublicis Sapient Engineering

XebiCon'17 : comment j’ai automatisé la gestion des incidents de photobox en...Publicis Sapient Engineering

XebiCon'17 : Monolith to microservice, histoire d’une transformation centrée...Publicis Sapient Engineering

Más de Publicis Sapient Engineering (20)

XebiCon'18 - Boostez vos modèles avec du Deep Learning distribué

XebiCon'18 - Comment j'ai développé un jeu vidéo avec des outils de développe...

XebiCon'18 - Les utilisateurs finaux, les oubliés de nos produits !

XebiCon'18 - Comment fausser l'interprétation de vos résultats avec des dataviz

XebiCon'18 - Le développeur dans la Pop Culture

XebiCon'18 - Architecturer son application mobile pour la durabilité

XebiCon'18 - Sécuriser son API avec OpenID Connect

XebiCon'18 - Structuration du Temps et Dynamique de Groupes, Théorie organisa...

XebiCon'18 - La sécurité, douce illusion même en 2018

XebiCon'18 - Utiliser Hyperledger Fabric pour la création d'une blockchain pr...

XebiCon'18 - Ce que l'histoire du métro Parisien m'a enseigné sur la création...

XebiCon'18 - La guerre des Frameworks n'aura pas lieu

XebiCon'18 - Orchestration : Conteneurs vs Musique

XebiCon'18 - Passage à l'échelle de mes applications Kafka-Streams

XebiCon'18 - Data Science Done Wrong

TEch4Exec - OUI.sncf propose des voyages moins chers grâce au Big Data et au ...

Tech4Exec - Pourquoi faut-il gérer votre projet (Big) data comme une start-up...

Tech4Exec - Etat de l’art et vulgarisation du Machine Learning

XebiCon'17 : comment j’ai automatisé la gestion des incidents de photobox en...

XebiCon'17 : Monolith to microservice, histoire d’une transformation centrée...

XebiCon'18 - Spark NLP, un an après

1. @Xebiconfr #Xebicon18 @auroredea Spark NLP, 1 an après Aurore de Amaral, Ingénieur Data 1

2. @Xebiconfr #Xebicon18 @auroredea Aurore de Amaral Ingénieur Data (passionnée par le TAL :D) 2

3. @Xebiconfr #Xebicon18 @auroredea 3

4. @Xebiconfr #Xebicon18 @auroredea 4

5. @Xebiconfr #Xebicon18 @auroredea Dernière version : 1.7.3 Utilise Spark/Spark ML 2.X.X Scala 2.11.X Java 7+ Développé et Open Sourcé depuis 1 an par : 5

6. @Xebiconfr #Xebicon18 @auroredea 6

7. @Xebiconfr #Xebicon18 @auroredea 7

8. @Xebiconfr #Xebicon18 @auroredea 8 Corpus annoté sur https://github.com/YoannDupont/WiNER-fr À l’extérieur, d’autres élus comme Philippe Goujon , député-maire Les Républicains du 15 e arrondissement de Paris , et Frédéric Lefebvre , député LR, tentaient de faire barrage. Ce dernier en appelle au Pape François « pour sauvegarder ce lieu de culte » [1] .

9. @Xebiconfr #Xebicon18 @auroredea 9

10. @Xebiconfr #Xebicon18 @auroredea 10

11. @Xebiconfr #Xebicon18 @auroredea 11 Phrases Tokenizer POS Maître Corbeau, ... [“Maître”, “Corbeau”, ”,”] [“Maître”,”N”], [“Corbeau”,”N”] Maître Renard, ... [“Maître”, “Renard”, ”,” ] [“Maître”,”N”], [“Renard”,”N”]

12. @Xebiconfr #Xebicon18 @auroredea Pré-entraîné sur l’anglais Pas de pré-entraînement BasicPipeline Pipeline AdvancedPipeline LightPipeline SentimentPipeline RecursivePipeline 12

13. @Xebiconfr #Xebicon18 @auroredea

14. @Xebiconfr #Xebicon18 @auroredea 14

15. @Xebiconfr #Xebicon18 @auroredea 15

16. @Xebiconfr #Xebicon18 @auroredea

XebiCon'18 - Spark NLP, un an après

Recomendados

Recomendados

Más contenido relacionado

Más de Publicis Sapient Engineering

Más de Publicis Sapient Engineering (20)

XebiCon'18 - Spark NLP, un an après