La Verteego Data Suite, suite logicielle open source et gratuite pour les data scientists. Installable depuis le lien GitHub accessible depuis l'onglet Lab du site web Verteego.com
Visual Studio 2013 / SharePoint 2013 duo de choc de 2010 à 2013 en un clin d’œil
Fiche Produit Verteego Data Suite, mars 2017
1. Et si le meilleur logiciel de Data Science était gratuit ?
Verteego Data Suite est une composition des meilleures briques open source
du marché, de la capture de données à la librairie d’analyse prédictive
SERVICES
Externalisation :
nous réalisons les apps
prédictives dont rêvent
vos équipes
Hébergement : cloud
public, cloud privé,
cloud hybride ou bien
votre propre infra
Support : de 100€
(5 questions par email)
à 500€ mensuels
(questions illimitées)
par utilisateur
Onboarding : formation,
setup, configuration,
assistance
MODULES
Made in Verteego :
• Interface utilisateurs
unifiée
• Echanges de données
d’uncomposant à l’autre
en streaming
• Programme d’installation
simple, rapide et
personnalisable
Nettoyez vos
données avec
OpenRefine
Créez des notebooks
en Python ou en R pour
scripter rapidement
vos PoC d’intelligence
artificielle avec Jupyter
Connectez-vous
à vos données au
travers des workflows
automatisés avec
Apache NiFi
Créez des modèles
prédictifs sur vos
données avec H2O
Explorez, visualisez
et partagez vos
données avec Superset
2. DATA SUITE : QUESTIONS / RÉPONSES
Pourquoi la Verteego Data Suite ?
On voulait donner accès à nos clients, au travers d’une solution best-
of-breed, aux meilleures briques tout le long de la chaîne typique de
travail d’un data scientist : l’extraction des données, le nettoyage des
données, l’analyse et la visualisation, le scripting pour personnali-
ser des tâches, du dashboarding collaboratif, et enfin tout un volet
prédictif et machine learning.
A qui s’adresse la Verteego Data Suite ?
Aux data scientists de métier, aux statisticiens qui ont de bonnes
connaissances informatiques, et aux développeurs informatiques à
qui nous permettons de réaliser rapidement leurs premiers projets de
data science une fois la prise en main de la suite logicielle effective.
Etant donné que Verteego est éditeur de logiciels,
pourquoi avez-vous choisi de faire appel à des
composants open source plutôt que d’avoir réalisé
des développements propriétaires ?
Parce qu’aujourd’hui, le marché du Big Data bouge tellement vite
qu’entre le moment où l’on pense un produit et le moment où on
le met sur le marché dans le logiciel propriétaire, et à moins d’avoir
des moyens financiers gigantesques permettant d’imposer un produit
comme standard par le marketing, le risque est grand d’être obsolète.
Ainsi, en faisant pour nos clients la veille technologique et en choisissant
en continu les meilleures briques, selon nous, pour eux, nous leur
garantissons d’avoir entre les mains ce qui se fait de mieux.
Quelles sont les réalisations techniques des équipes
Produit de Verteego au sein de la Verteego Data Suite ?
Outre la veille technologique, Verteego réalise la colonne vertébrale
logicielle qui permet aux données de circuler en streaming d’un
module à l’autre, le design et la mise en oeuvre d’une interface utilisa-
teurs aussi unifiée et homogène que possible entre des composants
développés par des communautés différentes, la production de toute
la documentation et des programmes d’installation, ainsi que les
partenariats avec les fournisseurs de services cloud pour couvrir
l’ensemble de la chaîne de valeur - y compris les couches basses.
Quel est l’intérêt de se former à la Verteego Data Suite ?
En se formant à la Verteego Data Suite, nos utilisateurs se forment en
même temps à quelques uns des composants de Data Science du marché
parmi les plus populaires au sein de la communauté mondiale des
Data Scientists.
Qu’est-ce que la Data Suite n’est pas ?
La Verteego Data Suite n’est par exemple pas une distribution Hadoop.
La Verteego Data Suite vient en aval de messageries type Kafka ou des
systèmes de stockage des fichiers qui peuvent exister. La Verteego Data
Suite se greffe sur ce type de systèmes et ne les propose donc
pas à l’installation. Toutefois, la Verteego Data Suite intègre
évidemment une brique d’orchestration des flux de don-
nées, nommément Apache NiFi, conçue pour interconnec-
ter des applications et gérer des problématiques de data lakes,
c’est-à-dire pour agréger différents types de données et les re-
travailler de manière à les assembler à un ou plusieurs endroits
qui permettent ensuite de réaliser des analyses ou des prédictions.
Apache NiFi est le point d’entrée et la colonne vertébrale de la Verteego
Data Suite.
Peut-on utiliser R dans la Data Suite ?
Peut-on y scripter en Python ?
LaVerteegoDataSuiteintègredescapacitésàécriredesNotebooks,via
la brique Jupyter. On peut faire du R dans la Data Suite et appeler direc-
tementlesscriptsquiontétéfaitsdansR.LaDataSuitepermetdegérer
tout l’environnement dont a besoin R pour fonctionner. Un kernel pré-
installépourRpermetdefaireduscriptingR.Danslaversioninstallable
par défaut de la Data Suite, nous avons intégré R, Python 2, Python 3
et Bash. Il est possible d’y ajouter Scala ou tout autre langage.
La Verteego Data Suite est-elle adaptée aux
démarches de Proof-of-Concept (PoC) comme aux
projets à même d’être exploités à grande échelle ?
Absolument. La Verteego Data Suite est adaptée aux PoC car
vous pourrez lancer rapidement vos projets et lancer différentes
approches. Et vous n’aurez pas à changer de technologie pour les
déployer à grande échelle car les technologies embarquées dans la Data
Suite sont rompues aux environnements de production complexes.
Où puis-je installer et héberger
la Verteego Data Suite ?
Tout d’abord, la Verteego Data Suite
se présente sous la forme d’une machine image installable sur les
serveurs Verteego ou sur l’infrastructure de nos clients. Aujourd’hui
(mars 2017), l’installation est pré-packagée pour la Google Cloud
Platform ou alors pour vos propres serveurs UNIX. La Verteego Data
Suite est parfaitement installable sur tous types de cloud publics,
hybrides ou privés.
www.verteego.com
@verteego_FR hello@verteego.com
8, rue du faubourg poissonnière - 75010 Paris - France
www.linkedin.com/company/verteego
+33 1 47 70 08 90