Fonction: Data Scientist

Auteur: Roger Morrison
Date De Création: 28 Septembre 2021
Date De Mise À Jour: 1 Peut 2024
Anonim
R Pour La Data Science
Vidéo: R Pour La Data Science

Contenu


Source: Sergey Khakimullin / iStockphoto

À emporter:

Les scientifiques de données exercent des tâches très variées qui varient considérablement d’une application à l’autre. Mais une chose qu’ils ont tous en commun est la volonté de bien utiliser les données.

Que fait un informaticien dans le domaine de l'intelligence artificielle et de l'apprentissage automatique? De nombreux professionnels qui traitent chaque jour de ce type de projets diraient que la question est difficile à répondre simplement. Une meilleure question serait: qu'est-ce que les scientifiques de données NE font PAS?

Un scientifique de données fait partie intégrante d'un processus d'IA ou de ML, en ce sens que tous ces projets dépendent de données volumineuses ou d'entrées complexes. Le data scientist est le spécialiste essentiel de la carrière qui sait travailler avec les données pour produire des résultats.


Cependant, il existe des moyens de parler de ce que fait un scientifique, de ses qualifications et de son rôle dans le processus.

Lis: 6 concepts de science de données clés que vous pouvez maîtriser grâce à l'apprentissage en ligne

Définitions variées, tâches variées

De nombreux experts décrivant le travail d'un scientifique en parlent en termes généraux.

«Dans les petites entreprises ou sur un nouveau marché, le rôle d’un scientifique est de convertir des sources de données relativement nouvelles (mais évidentes) en éléments permettant de résoudre un problème pour un utilisateur final, ce qui aurait été impossible auparavant. les technologies utilisées n’existaient pas », déclare Antonio Hicks, responsable de compte chez Mercury Global Partners. «Le candidat idéal est un mathématicien, un ingénieur en logiciel et un entrepreneur.»


D'autres font écho à cette idée de base, mentionnant les données dont les scientifiques ont besoin pour s'attaquer aux projets de modélisation.

«L'attribut le plus important dont un scientifique de données a besoin est une profonde curiosité vis-à-vis du monde qui l'entoure: qu'il s'agisse de répondre à des questions ou de créer des modèles, la volonté de comprendre le problème qui se pose à eux est essentielle», déclare Erin Akinci, responsable Data Scientist. à Asana. «À partir de là, la plupart des gens auront besoin de compétences en mathématiques et en programmation pour trouver des solutions, mais les types spécifiques de mathématiques et de programmation varient considérablement en fonction du domaine de compétence de la science des données.»

Pas de bugs, pas de stress - Votre guide étape par étape pour créer un logiciel qui change la vie sans vous détruire

Vous ne pouvez pas améliorer vos compétences en programmation lorsque personne ne se soucie de la qualité des logiciels.

«Un excellent travail scientifique a plus à voir avec la façon dont un scientifique envisage un problème que les outils qu'il utilise pour le résoudre», ajoute Charlie Burgoyne, fondateur et PDG de Valkyrie Intelligence. Valkyrie est une société de conseil en sciences appliquées dotée de projets impressionnants tels que le Mark I, un appareil réseau dédié qui stimule la formation et les tests de réseaux neuronaux, améliorant ainsi les possibilités offertes par les précédentes plates-formes d’apprentissage automatique en nuage.

«Le marché exige des scientifiques qui maîtrisent le développement Python, la conception de réseaux neuronaux et la possibilité de remodeler un référentiel de données dans la dernière architecture de base de données», déclare Burgoyne. «Ces capacités, cependant, sont des enjeux de table pour un scientifique talentueux. Ce qui est moins évident, c’est l’aptitude du scientifique à la curiosité intrépide, à l’ingéniosité agressive et à l’adhésion à la méthode scientifique. "

Les compétences d'un scientifique de données

Ainsi, en ce qui concerne les compétences pratiques, les scientifiques de données ont besoin de créativité et de savoir-faire en matière de modélisation. Ils peuvent également tirer un grand avantage de leurs «compétences techniques», telles que l’expérience de la programmation en Python, C ++ ou d’autres langages courants appliqués aux projets ML.

«Python et C ++ sont essentiels et être en mesure de combiner les compétences de codage avec l'analyse et le traitement de données et les statistiques sont des compétences essentielles qui permettront à un spécialiste des données de se démarquer en tant que candidat ou employé fort», déclare Val Streif chez Pramp, une plate-forme d'interviews simulées en ligne pour les ingénieurs en logiciel, les développeurs et les scientifiques de données. "Même si certaines compétences en programmation pourraient être gérées en associant un informaticien à un développeur, il est beaucoup plus facile de combiner les deux compétences en une, du point de vue d'une entreprise."

D'autres experts ajoutent R, Hadoop, Spark, Sas et Java à la liste, ainsi que des technologies telles que Tableau, Hive et MATLAB.

Tous ces éléments donnent lieu à un CV impressionnant, mais certains de ceux qui ont l'expérience du recrutement de données estiment que l'autre côté «humain» compte également. (L'un des types de data scientist est celui des citoyens. Pour en savoir plus, reportez-vous à la section Le rôle des scientifiques citoyens dans le Big Data World.)

«Traditionnellement, les personnes ayant une éducation artistique différente dans le domaine des arts libéraux sont d’excellents informaticiens», explique Burgoyne, distinguant ainsi les ingénieurs du bâtiment et les informaticiens, dont le travail peut être beaucoup plus conceptuel. Il continue:

Une expertise dans un domaine traditionnel des STEM avec une spécialisation complémentaire dans les domaines des sciences humaines, des arts ou du commerce fournit les qualités qui font un excellent scientifique axé sur l'industrie. Il faut dire qu’il est tout aussi important que l’organisation puisse exploiter ces qualités et forger leur ferveur et leurs méthodes de manière productive. J'ai observé que, lorsqu'une initiative de science des données échouait, l'organisation était aussi susceptible d'être aussi coupable que les scientifiques. Les scientifiques ne sont pas des ingénieurs. Ils ne sont pas motivés pour exécuter et construire. Ils sont poussés à découvrir et à comprendre. Les organisations qui comprennent cette différence sont bien récompensées pour la culture de ces deux champs.

En ce qui concerne ce à quoi les scientifiques s’appliquent généralement, cela concerne les objectifs fondamentaux de la société. Certaines entreprises recherchent un Internet décentralisé - certaines jouent avec l'IoT ou le SaaS. D'autres essaient de faire œuvre de pionnier en matière d'IA «conviviale», «éthique» ou «transparente».

Quoi qu’il en soit, les scientifiques de données vont probablement combler le fossé entre les métriques exactes sur les données qu’ils utilisent, quelle que soit la pile technologique utilisée, et le travail gratuit de conceptualisation de la fonctionnalité AI / ML.

«Nous embauchons des experts en données pour gérer la collecte et le nettoyage des données, ainsi que pour traduire ces données en informations significatives», a déclaré Michael Hupp, responsable de la science et de l'analyse des données chez G2 Crowd. Il élabore:

Cela implique généralement de gérer tous les algorithmes importants du moteur de données d’une entreprise et de maîtriser les principaux outils d’analyse et les langages. Ces dernières années, des domaines émergents tels que le traitement du langage naturel, l’apprentissage automatique et d’autres formes d’analyse basées sur l’IA ont également été abordés. Les scientifiques de données les plus performants sont ceux qui associent leurs compétences techniques à une capacité d'apprentissage rapide et à la capacité de communiquer efficacement les informations qu'ils découvrent pour qu'ils aient un sens pour leur entreprise.

Grâce à ces types d’éclairages, il est plus facile pour les jeunes professionnels ou les étudiants de déterminer si les spécialistes des données joueraient un rôle intéressant pour eux et comment acquérir des compétences. L’apprentissage des STEM est de plus en plus accessible dans les écoles du pays, mais rien ne remplace la passion du codage et de la technologie, ainsi que la capacité d’apprendre à la volée.