Grâce à une vision globale des données de son entreprise, le data scientist est capable d'aider sa direction ou les différents services (marketing, qualité, process...) à prendre des décisions grâce au traitement et à l'analyse de données fiables.
Le data scientist est missionné par un service ou la direction de son entreprise pour collecter, organiser et exploiter des données (aussi appelées big data à cause de leur nombre). Les entreprises ont désormais de grands volumes de données à disposition. Le data scientist les " fait parler " afin d'apporter des éléments d'aide à la décision.
Son travail commence par l'analyse de la demande : exploiter des données industrielles pour une meilleure productivité, améliorer la qualité ou faire de la maintenance préventive en analysant les pannes... Souvent, le data scientist travaille sur les données des clients ou des données publiques à des fins marketing. Il récupère les plus pertinentes sur des serveurs, des fichiers, des bases de données, etc. et les " nettoie ", pour les mettre au bon format ou éliminer celles qui sont inexploitables.
Vient ensuite la modélisation et la création d'algorithmes pour croiser et analyser les données. Des essais et ajustements sont nécessaires durant cette phase. La restitution des résultats se fait sous forme de rapports, de graphes, de tableaux ou d'applications. Le data scientist est chargé de l'ensemble de ces tâches dans lesquelles il est aidé par d'autres professionnels des datas, de graphistes, etc.
Apache Hadoop et Spark, Map Reduce, bases de données NoSQL, langage de programmation SAS, R, Python... Le data scientist doit maîtriser de nombreux programmes informatiques pour mener à bien la collecte, l'analyse et la restitution des données. La programmation, les mathématiques appliquées et en particulier les statistiques n'ont pas de secret pour lui.
On demande souvent au data scientist de gérer et de conduire des projets. Il doit donc être à l'aise avec la communication orale et écrite, le suivi d'équipes et l'animation de réunion. Pédagogue, il sait se mettre à la portée de ses interlocuteurs et sait convaincre. On pourra aussi lui demander de gérer un budget et/ou d'évaluer le coût de ses interventions.
Méthodique et organisé, il travaille généralement en mode projets, pouvant durer de quelques semaines à quelques mois. Il doit aussi être force de proposition et apporter des solutions pour une meilleure collecte des données par exemple, l'achat de nouveaux outils, etc. L'anglais technique est indispensable, notamment pour suivre les évolutions techniques dans son secteur qui lui permettront de proposer de nouveaux modèles d'analyse, des présentations lisibles par tous, etc.
Au départ surtout recherchés dans le domaine du e-commerce, de la finance-assurance ou de la grande distribution, les data scientists sont désormais recrutés dans tous les secteurs d'activités, dans les start-up comme dans les grands groupes, et notamment dans l'industrie. Le secteur des big data est très porteur et les data scientists avec une première expérience sont particulièrement demandés pour leur vision transversale sur les données. Paris, Lille, Lyon, Toulouse et Grenoble emploient le plus grand nombre de data scientists.
Le data scientist démarre souvent au poste de data analyst, sur un périmètre réduit, avant de se voir confier des projets de plus en plus importants et, finalement, la gestion de l'ensemble des données de l'entreprise en tant que data scientist.
Dans une grosse structure, le data scientist peut évoluer après quelques années vers le poste de chief data scientist ou chief data officer qui manage une équipe de data scientists. Responsable des projets d'analyse et des outils à mettre en place, le chief data scientist prend part au processus de décision de l'entreprise. Le data scientist peut également prendre la direction des systèmes d'information de l'entreprise.