Science des données ou apprentissage automatique? Heres Comment repérer la différence

Auteur: Laura McKinney
Date De Création: 3 Avril 2021
Date De Mise À Jour: 1 Juillet 2024
Anonim
Science des données ou apprentissage automatique? Heres Comment repérer la différence - La Technologie
Science des données ou apprentissage automatique? Heres Comment repérer la différence - La Technologie

Contenu


Source: Elnur / Dreamstime.com

À emporter:

La science des données et l'apprentissage automatique sont très différents. À certains égards, l’un peut être considéré comme un sous-ensemble de l’autre. Les deux sont importants dans les progrès informatiques actuels.

Dans ce nouveau monde d’intelligence artificielle et de gestion de données, il est facile d’être dérouté par certains des termes les plus couramment utilisés dans le monde informatique.

Par exemple, la science des données et l'apprentissage automatique ont beaucoup à faire. Il n’est pas surprenant que de nombreuses personnes ayant une connaissance passagère de ces disciplines auraient du mal à comprendre en quoi elles diffèrent les unes des autres.

Voici le meilleur moyen de séparer la science des données de l’apprentissage automatique, en tant que principe et en tant qu’approche technologique.


Science des données et apprentissage automatique: terminologie large et étroite

Tout d’abord, la science des données est vraiment une vaste catégorie de technologies englobant de nombreux types de projets et de créations. (Pour plus d'informations sur ce qui est impliqué dans un travail lié aux données informatiques, voir Fonction: Scientifique de données.)

La science des données consiste essentiellement à travailler avec le Big Data. Cette loi est apparue comme la loi de Moore et la prolifération de dispositifs de stockage plus efficaces a entraîné la collecte d’énormes quantités de données par les entreprises et d’autres parties. Ensuite, des plates-formes et des outils Big Data comme Hadoop ont commencé à redéfinir l'informatique en modifiant le fonctionnement de la gestion des données. Aujourd'hui, avec le cloud et la conteneurisation, ainsi que de nouveaux modèles, le Big Data est devenu un facteur déterminant de notre mode de travail et de vie.


Dans sa forme la plus simple, la science des données est la façon dont nous gérons ces données, du nettoyage à l’affinage, en passant par l’affinage pour les utiliser sous la forme de connaissances.

La définition de l'apprentissage automatique est beaucoup plus étroite. En apprentissage automatique, les technologies enregistrent des données et les transforment en algorithmes afin de simuler des processus cognitifs humains qualifiés d’apprentissage. En d’autres termes, une fois les données saisies et entraînées, l’ordinateur est en mesure de fournir ses propres résultats. , où la technologie semble avoir tiré les enseignements des processus mis en place par les programmeurs.

Ensemble de compétences en science des données et en apprentissage automatique

Une autre façon de contraster la science des données et l’apprentissage automatique consiste à examiner les différentes compétences les plus utiles aux professionnels de l’un ou l’autre de ces domaines.

Pas de bugs, pas de stress - Votre guide étape par étape pour créer un logiciel qui change la vie sans vous détruire

Vous ne pouvez pas améliorer vos compétences en programmation lorsque personne ne se soucie de la qualité des logiciels.

De l’avis général, les scientifiques de données tirent parti de leurs compétences approfondies en analyse et en mathématiques, de leur expérience pratique des technologies de base de données et de la connaissance de langages de programmation tels que Python ou d’autres progiciels utilisés pour l’analyse de données volumineuses.

«Toute personne intéressée par une solide carrière dans le domaine de la science des données doit acquérir des compétences clés dans trois départements: analyse, programmation et connaissance du domaine», écrit Srihari Sasikumar chez Simplilearn. «En approfondissant un niveau, les compétences suivantes vous aideront à vous positionner en tant qu’informaticien: connaissance approfondie de Python, SAS, R (et) Scala, expérience pratique du codage de bases de données SQL, capacité de travailler avec des données non structurées de diverses sources telles que la vidéo et les médias sociaux, comprennent de multiples fonctions analytiques (et) la connaissance de l’apprentissage automatique. ”

En ce qui concerne l’apprentissage automatique, les experts citent souvent les compétences en modélisation de données, les connaissances en probabilités et statistiques et des compétences plus étendues en programmation comme outils utiles dans la boîte à outils de l’ingénieur en apprentissage automatique.

Comment repérer l'apprentissage automatique

L’essentiel ici est que toutes sortes d’objets comprennent le travail en informatique, mais ce n’est pas un apprentissage automatique, sauf si vous avez un régime très strict mis en place pour aider l’ordinateur à tirer les leçons de ses entrées.

Lorsque cela est en place, il en résulte des systèmes étonnamment capables qui peuvent avoir de nombreux effets sur nos vies.

«Une grande partie de ce que nous faisons avec l'apprentissage automatique se passe sous la surface», aurait déclaré le fondateur d'Amazon, Jeff Bezos, soulignant certaines des applications de ces types de systèmes. «L'apprentissage automatique pilote nos algorithmes de prévision de la demande, de classement de la recherche de produits, de recommandations de produits et d'offres, de placements dans le marchandisage, de détection des fraudes, de traductions et bien plus encore. Même si elle est moins visible, l’apprentissage automatique aura une grande incidence sur ce type d’apprentissage, à savoir l’amélioration discrète mais significative des opérations principales. »

L’apparition du réseau de neurones est l’un des exemples les plus utiles. Il s’agit d’une méthode courante et répandue de configuration des processus d’apprentissage automatique.

Dans sa forme la plus élémentaire, le réseau de neurones est composé de couches de neurones artificiels. Chaque neurone artificiel individuel a une fonctionnalité équivalente à un neurone biologique - mais au lieu de synapses et de dendrites, il possède des entrées, une fonction d'activation et des sorties éventuelles.

Le réseau de neurones est conçu pour agir comme un cerveau humain et les professionnels de l'apprentissage automatique utilisent souvent ce modèle pour créer des résultats d'apprentissage automatique.

Cependant, ce n’est pas le seul moyen d’apprentissage automatique. Certains projets plus rudimentaires d’apprentissage automatique consistent simplement à montrer à un ordinateur un large éventail de photographies (ou à lui fournir d’autres données brutes), à saisir des idées au moyen du processus d’apprentissage automatique supervisé et de données d’étiquette, et à permettre à l’ordinateur de faire la distinction entre diverses formes ou objets dans un champ visuel. (Pour connaître les bases de l'apprentissage automatique, consultez Machine Learning 101.)

Deux disciplines de pointe

En conclusion, l'apprentissage automatique est un élément précieux de la science des données. Mais la science des données représente la frontière la plus vaste et le problème de l’apprentissage automatique.

D'une certaine manière, on pourrait dire que l'apprentissage automatique ne se produirait jamais sans le Big Data. Les mégadonnées en elles-mêmes ne créaient pas d’apprentissage automatique, mais après avoir rassemblé tellement de données que nous ne savions presque pas quoi en faire, les plus grands esprits ont imaginé ces processus de bio-simulation comme un moyen suralimenté. de fournir des idées.

Une autre bonne chose à garder à l'esprit est que la science des données peut être appliquée de deux manières principales: nous pouvons adopter l'apprentissage par la machine et l'intelligence artificielle, laisser les ordinateurs penser pour nous, ou nous pouvons ramener la science des données à une approche plus centrée sur l'humain. l'ordinateur présente simplement les résultats et nous, les humains, prenons les décisions.

C’est ce qui pousse certains experts, y compris certains des plus grands innovateurs d’aujourd’hui, à demander une comptabilité plus dynamique de la manière dont nous utilisons ces technologies.

"(AI) est capable de faire bien plus que ce que tout le monde sait et le taux d'amélioration est exponentiel", aurait déclaré Elon Musk, tout en avertissant que l'apprentissage automatique et les programmes d'intelligence artificielle devaient faire l'objet d'une surveillance.

Quoi qu’il en soit, la science des données et l’apprentissage automatique sont des éléments essentiels du progrès que nous réalisons en tant que sociétés dans le domaine de la technologie.