Didier Gaultier, Directeur Data Science & IA (Business & Decision), identifie quatre difficultés principales auxquelles se heurtent souvent les projets Data Science, avec des pistes concrètes à mettre en œuvre pour les surmonter. 1. L'enjeu de la donnée « en silos »
Il est très fréquent aujourd'hui que les données en entreprise soient « silotées »: chaque métier dispose de son propre système d'information (SI). La donnée constituant la base du projet, il est crucial pour les entreprises de s'inscrire dans une démarche Data Centric en:
Plaçant la donnée au centre du SI: construction de datalake/datahub; Disposant d'une équipe dédiée; Mettant en place une gouvernance des données. 2. Projet Data: Les 5 étapes cruciales by DataScientest. Les prérequis et l'organisation du projet
Avant de pouvoir effectuer un cadrage du projet et lancer un éventuel pilote, deux prérequis sont essentiels. J-16
Roadshow Data Cloud
09 Juin 2022
| 08h30 – 14h00
Marseille
S'inscrire
Comprendre les enjeux métiers
La bonne compréhension du métier et de ses problématiques doit être acquise.
Projet Data: Les 5 Étapes Cruciales By Datascientest
Il faudra donc créer un algorithme de Machine Learning souvent pour pouvoir donner de la valeur à la donnée. Il faudra donc définir les besoins et choisir le bon algorithme qui répond à la problématique. Est-ce que l'exploitation implique toujours du Machine Learning? La réponse est non. Très souvent dans les projets Data Science, on va utiliser le Machine Learning mais il n'est pas rare de devoir simplement créer un dashboard d'une étude statistique ou bien définir des KPIs à suivre etc. Simplement, il est important de garder en tête que l'objectif de la phase d'exploitation est de donner de la valeur à la donnée. Quels outils utiliser? Pour la partie exploitation, on restera sur des librairies et framework Python à connaître. Voici donc les principaux: Sklearn pour le Machine Learning TensorFlow, Spacy pour le Deep Learning et le NLP Bien sûr, vous aurez d'autres outils mais en commençant par ceux-là, vous couvrirez déjà une bonne partie des besoins. Définition On l'appelle aussi Déploiement, l'objectif de la mise en production est de porter le projet à hauteur de l'organisation.
Et ceci est une bonne nouvelle car cela offre à l'extraction et à l'analyse des données un grand potentiel. Les dark data attendent juste qu'un esprit curieux les utilise. Alors si vous réfléchissez à l'endroit où vous souhaitez envoyer vos enfant étudier, pensez à cette opportunité. Des cas d'utilisation de #bigdata sérieux, amusants et même surprenants, à des fins intéressantes. Profitez-en bien! Tweet
C'est tout pour aujourd'hui. La semaine prochaine nous publierons un autre article ayant pour thème les projets de big data et plus particulièrement leur utilisation en vue de sauver des vies et d'attraper des criminels. Restez connectés!