SlideShare una empresa de Scribd logo
1 de 2
Descargar para leer sin conexión
Et si le meilleur logiciel de Data Science était gratuit ?
Verteego Data Suite est une composition des meilleures briques open source
du marché, de la capture de données à la librairie d’analyse prédictive
SERVICES
Externalisation :
nous réalisons les apps
prédictives dont rêvent
vos équipes
Hébergement : cloud
public, cloud privé,
cloud hybride ou bien
votre propre infra
Support : de 100€
(5 questions par email)
à 500€ mensuels
(questions illimitées)
par utilisateur
Onboarding : formation,
setup, configuration,
assistance
MODULES
Made in Verteego :
• Interface utilisateurs
unifiée
• Echanges de données
d’uncomposant à l’autre
en streaming
• Programme d’installation
simple, rapide et
personnalisable
Nettoyez vos
données avec
OpenRefine
Créez des notebooks
en Python ou en R pour
scripter rapidement
vos PoC d’intelligence
artificielle avec Jupyter
Connectez-vous
à vos données au
travers des workflows
automatisés avec
Apache NiFi
Créez des modèles
prédictifs sur vos
données avec H2O
Explorez, visualisez
et partagez vos
données avec Superset
DATA SUITE : QUESTIONS / RÉPONSES
Pourquoi la Verteego Data Suite ?
On voulait donner accès à nos clients, au travers d’une solution best-
of-breed, aux meilleures briques tout le long de la chaîne typique de
travail d’un data scientist : l’extraction des données, le nettoyage des
données, l’analyse et la visualisation, le scripting pour personnali-
ser des tâches, du dashboarding collaboratif, et enfin tout un volet
prédictif et machine learning.
A qui s’adresse la Verteego Data Suite ?
Aux data scientists de métier, aux statisticiens qui ont de bonnes
connaissances informatiques, et aux développeurs informatiques à
qui nous permettons de réaliser rapidement leurs premiers projets de
data science une fois la prise en main de la suite logicielle effective.
Etant donné que Verteego est éditeur de logiciels,
pourquoi avez-vous choisi de faire appel à des
composants open source plutôt que d’avoir réalisé
des développements propriétaires ?
Parce qu’aujourd’hui, le marché du Big Data bouge tellement vite
qu’entre le moment où l’on pense un produit et le moment où on
le met sur le marché dans le logiciel propriétaire, et à moins d’avoir
des moyens financiers gigantesques permettant d’imposer un produit
comme standard par le marketing, le risque est grand d’être obsolète.
Ainsi, en faisant pour nos clients la veille technologique et en choisissant
en continu les meilleures briques, selon nous, pour eux, nous leur
garantissons d’avoir entre les mains ce qui se fait de mieux.
Quelles sont les réalisations techniques des équipes
Produit de Verteego au sein de la Verteego Data Suite ?
Outre la veille technologique, Verteego réalise la colonne vertébrale
logicielle qui permet aux données de circuler en streaming d’un
module à l’autre, le design et la mise en oeuvre d’une interface utilisa-
teurs aussi unifiée et homogène que possible entre des composants
développés par des communautés différentes, la production de toute
la documentation et des programmes d’installation, ainsi que les
partenariats avec les fournisseurs de services cloud pour couvrir
l’ensemble de la chaîne de valeur - y compris les couches basses.
Quel est l’intérêt de se former à la Verteego Data Suite ?
En se formant à la Verteego Data Suite, nos utilisateurs se forment en
même temps à quelques uns des composants de Data Science du marché
parmi les plus populaires au sein de la communauté mondiale des
Data Scientists.
Qu’est-ce que la Data Suite n’est pas ?
La Verteego Data Suite n’est par exemple pas une distribution Hadoop.
La Verteego Data Suite vient en aval de messageries type Kafka ou des
systèmes de stockage des fichiers qui peuvent exister. La Verteego Data
Suite se greffe sur ce type de systèmes et ne les propose donc
pas à l’installation. Toutefois, la Verteego Data Suite intègre
évidemment une brique d’orchestration des flux de don-
nées, nommément Apache NiFi, conçue pour interconnec-
ter des applications et gérer des problématiques de data lakes,
c’est-à-dire pour agréger différents types de données et les re-
travailler de manière à les assembler à un ou plusieurs endroits
qui permettent ensuite de réaliser des analyses ou des prédictions.
Apache NiFi est le point d’entrée et la colonne vertébrale de la Verteego
Data Suite.
Peut-on utiliser R dans la Data Suite ?
Peut-on y scripter en Python ?
LaVerteegoDataSuiteintègredescapacitésàécriredesNotebooks,via
la brique Jupyter. On peut faire du R dans la Data Suite et appeler direc-
tementlesscriptsquiontétéfaitsdansR.LaDataSuitepermetdegérer
tout l’environnement dont a besoin R pour fonctionner. Un kernel pré-
installépourRpermetdefaireduscriptingR.Danslaversioninstallable
par défaut de la Data Suite, nous avons intégré R, Python 2, Python 3
et Bash. Il est possible d’y ajouter Scala ou tout autre langage.
La Verteego Data Suite est-elle adaptée aux
démarches de Proof-of-Concept (PoC) comme aux
projets à même d’être exploités à grande échelle ?
Absolument. La Verteego Data Suite est adaptée aux PoC car
vous pourrez lancer rapidement vos projets et lancer différentes
approches. Et vous n’aurez pas à changer de technologie pour les
déployer à grande échelle car les technologies embarquées dans la Data
Suite sont rompues aux environnements de production complexes.
Où puis-je installer et héberger
la Verteego Data Suite ?
Tout d’abord, la Verteego Data Suite
se présente sous la forme d’une machine image installable sur les
serveurs Verteego ou sur l’infrastructure de nos clients. Aujourd’hui
(mars 2017), l’installation est pré-packagée pour la Google Cloud
Platform ou alors pour vos propres serveurs UNIX. La Verteego Data
Suite est parfaitement installable sur tous types de cloud publics,
hybrides ou privés.
www.verteego.com
@verteego_FR hello@verteego.com
8, rue du faubourg poissonnière - 75010 Paris - France
www.linkedin.com/company/verteego
+33 1 47 70 08 90

Más contenido relacionado

Destacado

Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME
 
Joe Witt presentation on Apache NiFi
Joe Witt presentation on Apache NiFiJoe Witt presentation on Apache NiFi
Joe Witt presentation on Apache NiFiMark Kerzner
 
Apache NiFi- MiNiFi meetup Slides
Apache NiFi- MiNiFi meetup SlidesApache NiFi- MiNiFi meetup Slides
Apache NiFi- MiNiFi meetup SlidesIsheeta Sanghi
 
Hadoop Interview Questions and Answers | Big Data Interview Questions | Hadoo...
Hadoop Interview Questions and Answers | Big Data Interview Questions | Hadoo...Hadoop Interview Questions and Answers | Big Data Interview Questions | Hadoo...
Hadoop Interview Questions and Answers | Big Data Interview Questions | Hadoo...Edureka!
 
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...Edureka!
 
Impact 2013 2963 - IBM Business Process Manager Top Practices
Impact 2013 2963 - IBM Business Process Manager Top PracticesImpact 2013 2963 - IBM Business Process Manager Top Practices
Impact 2013 2963 - IBM Business Process Manager Top PracticesBrian Petrini
 
Introducing procure to pay
Introducing procure to payIntroducing procure to pay
Introducing procure to paysbcwebdev
 
AP – A Catalyst for P2P Transformation
AP – A Catalyst for P2P TransformationAP – A Catalyst for P2P Transformation
AP – A Catalyst for P2P TransformationTradeshift
 
ORCID: ¿una solución definitiva para la identificación de autores?
ORCID: ¿una solución definitiva para la identificación de autores?ORCID: ¿una solución definitiva para la identificación de autores?
ORCID: ¿una solución definitiva para la identificación de autores?SocialBiblio
 
POPIN GROUP EVENTS
POPIN GROUP EVENTSPOPIN GROUP EVENTS
POPIN GROUP EVENTSPop in Group
 
Transforming your procure to pay process
Transforming your procure to pay processTransforming your procure to pay process
Transforming your procure to pay processLisa Wilberding
 
Scaling up with Cisco Big Data: Data + Science = Data Science
Scaling up with Cisco Big Data: Data + Science = Data ScienceScaling up with Cisco Big Data: Data + Science = Data Science
Scaling up with Cisco Big Data: Data + Science = Data ScienceeRic Choo
 
Indexing thousands of writes per second with redis
Indexing thousands of writes per second with redisIndexing thousands of writes per second with redis
Indexing thousands of writes per second with redispauldix
 
Greenplum- an opensource
Greenplum- an opensourceGreenplum- an opensource
Greenplum- an opensourceRosy Mani
 
Yazılım mühendisliğinde i̇nsan bilgisayar etkileşimi
Yazılım mühendisliğinde i̇nsan bilgisayar etkileşimiYazılım mühendisliğinde i̇nsan bilgisayar etkileşimi
Yazılım mühendisliğinde i̇nsan bilgisayar etkileşimiBetul Kesimal
 

Destacado (20)

Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
 
Joe Witt presentation on Apache NiFi
Joe Witt presentation on Apache NiFiJoe Witt presentation on Apache NiFi
Joe Witt presentation on Apache NiFi
 
Apache NiFi- MiNiFi meetup Slides
Apache NiFi- MiNiFi meetup SlidesApache NiFi- MiNiFi meetup Slides
Apache NiFi- MiNiFi meetup Slides
 
Hadoop Interview Questions and Answers | Big Data Interview Questions | Hadoo...
Hadoop Interview Questions and Answers | Big Data Interview Questions | Hadoo...Hadoop Interview Questions and Answers | Big Data Interview Questions | Hadoo...
Hadoop Interview Questions and Answers | Big Data Interview Questions | Hadoo...
 
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
 
Impact 2013 2963 - IBM Business Process Manager Top Practices
Impact 2013 2963 - IBM Business Process Manager Top PracticesImpact 2013 2963 - IBM Business Process Manager Top Practices
Impact 2013 2963 - IBM Business Process Manager Top Practices
 
Introducing procure to pay
Introducing procure to payIntroducing procure to pay
Introducing procure to pay
 
AP – A Catalyst for P2P Transformation
AP – A Catalyst for P2P TransformationAP – A Catalyst for P2P Transformation
AP – A Catalyst for P2P Transformation
 
Procure to Pay
Procure to Pay Procure to Pay
Procure to Pay
 
Movies
MoviesMovies
Movies
 
Verb patterns modified
Verb patterns modifiedVerb patterns modified
Verb patterns modified
 
ORCID: ¿una solución definitiva para la identificación de autores?
ORCID: ¿una solución definitiva para la identificación de autores?ORCID: ¿una solución definitiva para la identificación de autores?
ORCID: ¿una solución definitiva para la identificación de autores?
 
POPIN GROUP EVENTS
POPIN GROUP EVENTSPOPIN GROUP EVENTS
POPIN GROUP EVENTS
 
Procure to pay cycle
Procure to pay cycleProcure to pay cycle
Procure to pay cycle
 
Transforming your procure to pay process
Transforming your procure to pay processTransforming your procure to pay process
Transforming your procure to pay process
 
Scaling up with Cisco Big Data: Data + Science = Data Science
Scaling up with Cisco Big Data: Data + Science = Data ScienceScaling up with Cisco Big Data: Data + Science = Data Science
Scaling up with Cisco Big Data: Data + Science = Data Science
 
Airjetloom
AirjetloomAirjetloom
Airjetloom
 
Indexing thousands of writes per second with redis
Indexing thousands of writes per second with redisIndexing thousands of writes per second with redis
Indexing thousands of writes per second with redis
 
Greenplum- an opensource
Greenplum- an opensourceGreenplum- an opensource
Greenplum- an opensource
 
Yazılım mühendisliğinde i̇nsan bilgisayar etkileşimi
Yazılım mühendisliğinde i̇nsan bilgisayar etkileşimiYazılım mühendisliğinde i̇nsan bilgisayar etkileşimi
Yazılım mühendisliğinde i̇nsan bilgisayar etkileşimi
 

Similar a Fiche Produit Verteego Data Suite, mars 2017

BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData, Inc.
 
Introduction au nouveau moteur de workflow de Microsoft : Flow
Introduction au nouveau moteur de workflow de Microsoft : FlowIntroduction au nouveau moteur de workflow de Microsoft : Flow
Introduction au nouveau moteur de workflow de Microsoft : FlowSabrine Chouk
 
Introduction au nouveau moteur de workflow de Microsoft : Flow (Serge Luca)
Introduction au nouveau moteur de workflow de Microsoft : Flow (Serge Luca)Introduction au nouveau moteur de workflow de Microsoft : Flow (Serge Luca)
Introduction au nouveau moteur de workflow de Microsoft : Flow (Serge Luca)serge luca
 
Agile Tour Paris 2014 : Ma stack d'outils Agiles, tout un programme !, Cedric...
Agile Tour Paris 2014 : Ma stack d'outils Agiles, tout un programme !, Cedric...Agile Tour Paris 2014 : Ma stack d'outils Agiles, tout un programme !, Cedric...
Agile Tour Paris 2014 : Ma stack d'outils Agiles, tout un programme !, Cedric...ENSIBS
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems Excelerate Systems
 
Pres azure paas tdf -rex-hager-vincent thavonekham-regional director-azug f...
Pres azure   paas tdf -rex-hager-vincent thavonekham-regional director-azug f...Pres azure   paas tdf -rex-hager-vincent thavonekham-regional director-azug f...
Pres azure paas tdf -rex-hager-vincent thavonekham-regional director-azug f...FactoVia
 
[XamarinDay] Deep dive des produits Xamarin part 2
[XamarinDay] Deep dive des produits Xamarin part 2[XamarinDay] Deep dive des produits Xamarin part 2
[XamarinDay] Deep dive des produits Xamarin part 2Cellenza
 
ExperienceNow - Découvrez comment Soitec modernise son IT et gagne en agilité...
ExperienceNow - Découvrez comment Soitec modernise son IT et gagne en agilité...ExperienceNow - Découvrez comment Soitec modernise son IT et gagne en agilité...
ExperienceNow - Découvrez comment Soitec modernise son IT et gagne en agilité...Devoteam
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Converteo
 
Manage Traceability with Apache Atlas flexible metadata repository.
Manage Traceability with Apache Atlas flexible metadata repository.Manage Traceability with Apache Atlas flexible metadata repository.
Manage Traceability with Apache Atlas flexible metadata repository.OW2
 
Editeurs de logiciels, innovez avec l'Intelligence Artificielle
Editeurs de logiciels, innovez avec l'Intelligence ArtificielleEditeurs de logiciels, innovez avec l'Intelligence Artificielle
Editeurs de logiciels, innovez avec l'Intelligence ArtificielleGuillaume Renaud
 
Retour d’expérience de la transformation DevOps de Microsoft au DevOps REX
Retour d’expérience de la transformation DevOps de Microsoft au DevOps REXRetour d’expérience de la transformation DevOps de Microsoft au DevOps REX
Retour d’expérience de la transformation DevOps de Microsoft au DevOps REXSamuel Metias
 
MEGA International: .NET Architect
MEGA International: .NET Architect MEGA International: .NET Architect
MEGA International: .NET Architect Jason De Oliveira
 
MEGA International: Senior .NET Developer
MEGA International: Senior .NET DeveloperMEGA International: Senior .NET Developer
MEGA International: Senior .NET DeveloperJason De Oliveira
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentariesRima Jamli Faidi
 
OpenStack & DevOps, l'Open Source au service du Cloud
OpenStack & DevOps, l'Open Source au service du CloudOpenStack & DevOps, l'Open Source au service du Cloud
OpenStack & DevOps, l'Open Source au service du CloudMichel-Marie Maudet
 
Visual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œil
Visual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œilVisual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œil
Visual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œilMicrosoft Technet France
 

Similar a Fiche Produit Verteego Data Suite, mars 2017 (20)

BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)
 
Introduction au nouveau moteur de workflow de Microsoft : Flow
Introduction au nouveau moteur de workflow de Microsoft : FlowIntroduction au nouveau moteur de workflow de Microsoft : Flow
Introduction au nouveau moteur de workflow de Microsoft : Flow
 
Introduction au nouveau moteur de workflow de Microsoft : Flow (Serge Luca)
Introduction au nouveau moteur de workflow de Microsoft : Flow (Serge Luca)Introduction au nouveau moteur de workflow de Microsoft : Flow (Serge Luca)
Introduction au nouveau moteur de workflow de Microsoft : Flow (Serge Luca)
 
Agile Tour Paris 2014 : Ma stack d'outils Agiles, tout un programme !, Cedric...
Agile Tour Paris 2014 : Ma stack d'outils Agiles, tout un programme !, Cedric...Agile Tour Paris 2014 : Ma stack d'outils Agiles, tout un programme !, Cedric...
Agile Tour Paris 2014 : Ma stack d'outils Agiles, tout un programme !, Cedric...
 
BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems
 
OneGeo Suite
OneGeo SuiteOneGeo Suite
OneGeo Suite
 
Pres azure paas tdf -rex-hager-vincent thavonekham-regional director-azug f...
Pres azure   paas tdf -rex-hager-vincent thavonekham-regional director-azug f...Pres azure   paas tdf -rex-hager-vincent thavonekham-regional director-azug f...
Pres azure paas tdf -rex-hager-vincent thavonekham-regional director-azug f...
 
[XamarinDay] Deep dive des produits Xamarin part 2
[XamarinDay] Deep dive des produits Xamarin part 2[XamarinDay] Deep dive des produits Xamarin part 2
[XamarinDay] Deep dive des produits Xamarin part 2
 
ExperienceNow - Découvrez comment Soitec modernise son IT et gagne en agilité...
ExperienceNow - Découvrez comment Soitec modernise son IT et gagne en agilité...ExperienceNow - Découvrez comment Soitec modernise son IT et gagne en agilité...
ExperienceNow - Découvrez comment Soitec modernise son IT et gagne en agilité...
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
Manage Traceability with Apache Atlas flexible metadata repository.
Manage Traceability with Apache Atlas flexible metadata repository.Manage Traceability with Apache Atlas flexible metadata repository.
Manage Traceability with Apache Atlas flexible metadata repository.
 
Editeurs de logiciels, innovez avec l'Intelligence Artificielle
Editeurs de logiciels, innovez avec l'Intelligence ArtificielleEditeurs de logiciels, innovez avec l'Intelligence Artificielle
Editeurs de logiciels, innovez avec l'Intelligence Artificielle
 
Retour d’expérience de la transformation DevOps de Microsoft au DevOps REX
Retour d’expérience de la transformation DevOps de Microsoft au DevOps REXRetour d’expérience de la transformation DevOps de Microsoft au DevOps REX
Retour d’expérience de la transformation DevOps de Microsoft au DevOps REX
 
MEGA International: .NET Architect
MEGA International: .NET Architect MEGA International: .NET Architect
MEGA International: .NET Architect
 
MEGA International: Senior .NET Developer
MEGA International: Senior .NET DeveloperMEGA International: Senior .NET Developer
MEGA International: Senior .NET Developer
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
 
OpenStack & DevOps, l'Open Source au service du Cloud
OpenStack & DevOps, l'Open Source au service du CloudOpenStack & DevOps, l'Open Source au service du Cloud
OpenStack & DevOps, l'Open Source au service du Cloud
 
Quoi de neuf dans Office 365?
Quoi de neuf dans Office 365?Quoi de neuf dans Office 365?
Quoi de neuf dans Office 365?
 
Visual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œil
Visual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œilVisual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œil
Visual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œil
 

Fiche Produit Verteego Data Suite, mars 2017

  • 1. Et si le meilleur logiciel de Data Science était gratuit ? Verteego Data Suite est une composition des meilleures briques open source du marché, de la capture de données à la librairie d’analyse prédictive SERVICES Externalisation : nous réalisons les apps prédictives dont rêvent vos équipes Hébergement : cloud public, cloud privé, cloud hybride ou bien votre propre infra Support : de 100€ (5 questions par email) à 500€ mensuels (questions illimitées) par utilisateur Onboarding : formation, setup, configuration, assistance MODULES Made in Verteego : • Interface utilisateurs unifiée • Echanges de données d’uncomposant à l’autre en streaming • Programme d’installation simple, rapide et personnalisable Nettoyez vos données avec OpenRefine Créez des notebooks en Python ou en R pour scripter rapidement vos PoC d’intelligence artificielle avec Jupyter Connectez-vous à vos données au travers des workflows automatisés avec Apache NiFi Créez des modèles prédictifs sur vos données avec H2O Explorez, visualisez et partagez vos données avec Superset
  • 2. DATA SUITE : QUESTIONS / RÉPONSES Pourquoi la Verteego Data Suite ? On voulait donner accès à nos clients, au travers d’une solution best- of-breed, aux meilleures briques tout le long de la chaîne typique de travail d’un data scientist : l’extraction des données, le nettoyage des données, l’analyse et la visualisation, le scripting pour personnali- ser des tâches, du dashboarding collaboratif, et enfin tout un volet prédictif et machine learning. A qui s’adresse la Verteego Data Suite ? Aux data scientists de métier, aux statisticiens qui ont de bonnes connaissances informatiques, et aux développeurs informatiques à qui nous permettons de réaliser rapidement leurs premiers projets de data science une fois la prise en main de la suite logicielle effective. Etant donné que Verteego est éditeur de logiciels, pourquoi avez-vous choisi de faire appel à des composants open source plutôt que d’avoir réalisé des développements propriétaires ? Parce qu’aujourd’hui, le marché du Big Data bouge tellement vite qu’entre le moment où l’on pense un produit et le moment où on le met sur le marché dans le logiciel propriétaire, et à moins d’avoir des moyens financiers gigantesques permettant d’imposer un produit comme standard par le marketing, le risque est grand d’être obsolète. Ainsi, en faisant pour nos clients la veille technologique et en choisissant en continu les meilleures briques, selon nous, pour eux, nous leur garantissons d’avoir entre les mains ce qui se fait de mieux. Quelles sont les réalisations techniques des équipes Produit de Verteego au sein de la Verteego Data Suite ? Outre la veille technologique, Verteego réalise la colonne vertébrale logicielle qui permet aux données de circuler en streaming d’un module à l’autre, le design et la mise en oeuvre d’une interface utilisa- teurs aussi unifiée et homogène que possible entre des composants développés par des communautés différentes, la production de toute la documentation et des programmes d’installation, ainsi que les partenariats avec les fournisseurs de services cloud pour couvrir l’ensemble de la chaîne de valeur - y compris les couches basses. Quel est l’intérêt de se former à la Verteego Data Suite ? En se formant à la Verteego Data Suite, nos utilisateurs se forment en même temps à quelques uns des composants de Data Science du marché parmi les plus populaires au sein de la communauté mondiale des Data Scientists. Qu’est-ce que la Data Suite n’est pas ? La Verteego Data Suite n’est par exemple pas une distribution Hadoop. La Verteego Data Suite vient en aval de messageries type Kafka ou des systèmes de stockage des fichiers qui peuvent exister. La Verteego Data Suite se greffe sur ce type de systèmes et ne les propose donc pas à l’installation. Toutefois, la Verteego Data Suite intègre évidemment une brique d’orchestration des flux de don- nées, nommément Apache NiFi, conçue pour interconnec- ter des applications et gérer des problématiques de data lakes, c’est-à-dire pour agréger différents types de données et les re- travailler de manière à les assembler à un ou plusieurs endroits qui permettent ensuite de réaliser des analyses ou des prédictions. Apache NiFi est le point d’entrée et la colonne vertébrale de la Verteego Data Suite. Peut-on utiliser R dans la Data Suite ? Peut-on y scripter en Python ? LaVerteegoDataSuiteintègredescapacitésàécriredesNotebooks,via la brique Jupyter. On peut faire du R dans la Data Suite et appeler direc- tementlesscriptsquiontétéfaitsdansR.LaDataSuitepermetdegérer tout l’environnement dont a besoin R pour fonctionner. Un kernel pré- installépourRpermetdefaireduscriptingR.Danslaversioninstallable par défaut de la Data Suite, nous avons intégré R, Python 2, Python 3 et Bash. Il est possible d’y ajouter Scala ou tout autre langage. La Verteego Data Suite est-elle adaptée aux démarches de Proof-of-Concept (PoC) comme aux projets à même d’être exploités à grande échelle ? Absolument. La Verteego Data Suite est adaptée aux PoC car vous pourrez lancer rapidement vos projets et lancer différentes approches. Et vous n’aurez pas à changer de technologie pour les déployer à grande échelle car les technologies embarquées dans la Data Suite sont rompues aux environnements de production complexes. Où puis-je installer et héberger la Verteego Data Suite ? Tout d’abord, la Verteego Data Suite se présente sous la forme d’une machine image installable sur les serveurs Verteego ou sur l’infrastructure de nos clients. Aujourd’hui (mars 2017), l’installation est pré-packagée pour la Google Cloud Platform ou alors pour vos propres serveurs UNIX. La Verteego Data Suite est parfaitement installable sur tous types de cloud publics, hybrides ou privés. www.verteego.com @verteego_FR hello@verteego.com 8, rue du faubourg poissonnière - 75010 Paris - France www.linkedin.com/company/verteego +33 1 47 70 08 90