4 mythes sur le démarrage d'un projet d'apprentissage machine

Auteur: Laura McKinney
Date De Création: 3 Avril 2021
Date De Mise À Jour: 24 Juin 2024
Anonim
4 mythes sur le démarrage d'un projet d'apprentissage machine - La Technologie
4 mythes sur le démarrage d'un projet d'apprentissage machine - La Technologie

Contenu


Source: monsitj / iStockphoto

À emporter:

En savoir plus sur ces mythes de l’apprentissage automatique pour mieux s’adapter à l’adoption en entreprise

Ce n’est pas une chose à prendre à la légère: commencer par un projet d’apprentissage automatique peut s'avérer un processus décourageant pour les cadres qui souhaitent tirer parti de cette tendance informatique mais qui peuvent manquer des connaissances internes pour bien comprendre les tenants et les aboutissants de ce qui fait la machine. projets d'apprentissage cocher.

Nous aborderons ici certaines des idées fausses fondamentales qui ont une incidence sur la manière dont les entreprises développent des technologies d’apprentissage automatique dans un marché en rapide évolution. (La science des données est un autre domaine que les entreprises mettent en œuvre, mais en quoi est-ce différent du ML? Découvrez-le dans Data Science ou Machine Learning? Voici comment identifier la différence.)


Mythe n ° 1: Plus de données, c'est toujours mieux

C'est vraiment l'un des plus grands mythes de l'apprentissage automatique. Les gens pensent que plus de données signifie plus de capacité à affiner des informations exploitables. Dans certains cas, ils ont raison, mais le plus souvent, l’inverse peut être vrai.

Davantage de données n’est préférable que si les données pertinentes ajoutent à l’ensemble de la situation. Les données doivent correspondre au modèle d’apprentissage automatique, sinon le programme peut souffrir de ce que l’on appelle «surapprentissage», les résultats de l’apprentissage automatique n’apparaissant pas comme ils le devraient.

«Les mauvaises performances en apprentissage machine sont dues à une sur-adaptation ou à une sous-valorisation des données», écrit Jason Brownlee dans Machine Learning Mastery.


Dans les statistiques, un ajustement fait référence au degré d'approximation d'une fonction cible. C'est une bonne terminologie à utiliser dans l'apprentissage machine, car les algorithmes d'apprentissage automatique supervisé cherchent à approximer la fonction de mappage sous-jacente inconnue pour les variables de sortie en fonction des variables d'entrée. Les statistiques décrivent souvent la qualité de l'ajustement en faisant référence aux mesures utilisées pour estimer le degré d'approximation de la fonction par rapport à la fonction cible.

En termes simples, des données superflues peuvent causer de graves problèmes. Avant de mettre en œuvre un projet d’apprentissage automatique, les dirigeants et autres parties prenantes doivent réfléchir et déterminer quels types de données sont spécifiques et constitueront la bonne base pour aller de l’avant.

Mythe n ° 2: les données dont nous disposons sont suffisamment bonnes

Encore une fois, les processus d’apprentissage automatique fonctionnent sur des modèles de données très précis. Les données ne sont pas suffisantes si elles ne sont pas clairement ciblées, sélectionnées ou évaluées pour tenir compte d'éléments tels que les biais et la variance.

Pas de bugs, pas de stress - Votre guide étape par étape pour créer un logiciel qui change la vie sans vous détruire

Vous ne pouvez pas améliorer vos compétences en programmation lorsque personne ne se soucie de la qualité des logiciels.

Une chose que vous entendez beaucoup dans le monde de l'apprentissage automatique est le biais incontrôlé. L'apprentissage automatique prend nos préjugés humains et les amplifie en transformant les données que le programme obtient en résultats potentiellement extrêmes.

Cela signifie que les données doivent être très ciblées pour compenser cette tendance.

Mythe # 3: C’est trop tôt pour nous!

Certaines entreprises craignent qu’il soit trop tôt pour se lancer dans l’apprentissage automatique. Mais si vous parlez à beaucoup d’innovateurs et d’entrepreneurs, ils vous diront que c’est le moment idéal pour prendre la parole.

Où que soit la tendance informatique, vous voulez être en avance sur la courbe. À l'avant-garde est la meilleure position. Attendre pour que tout soit parfait pourrait coûter une entreprise à long terme. (Pour en savoir plus sur les raisons pour lesquelles les entreprises n’ont pas encore implémenté le ML, voir 4 Barrages routiers qui freinent l’adoption de l’apprentissage automatique.)

Mythe # 4: L'apprentissage automatique est toujours le même

Il existe certainement un large éventail de programmes d’apprentissage automatique.

Certains d’entre eux reposent essentiellement sur un seul algorithme: ils sont mathématiquement lisibles et transparents. Les ingénieurs peuvent voir en quoi les données stockées sont en corrélation avec ce qui sort du système.

D'autres processus d'apprentissage machine sont beaucoup plus élaborés et difficiles à comprendre. Les réseaux de neurones composés de neurones artificiels peuvent essentiellement devenir une «boîte noire» dans laquelle même les meilleurs ingénieurs ont du mal à suivre les données dans le système ou à expliquer le fonctionnement des algorithmes.

«Les technologies les plus performantes - à savoir les réseaux de neurones profonds - sont notoirement opaques et offrent peu d'indices sur la façon dont elles parviennent à leurs conclusions», écrit Ariel Bleicher de Scientific American, qui passe en revue certains aspects de cette énigme essentielle.

Des outils tels que les réseaux d'état d'écho prennent cette idée de boîte noire et s'exécutent avec elle. Cela rend d'autant plus difficile de vraiment bien comprendre le fonctionnement de ces systèmes.

Mythe n ° 5: L'apprentissage automatique ne fonctionne qu'avec des données soigneusement sélectionnées

Bien que le point ci-dessus concernant les données de précision reste vrai, deux types différents d’apprentissage automatique fonctionnent sur des bases fondamentalement différentes.

Un type d'apprentissage automatique appelé apprentissage automatique supervisé traite des données étiquetées - les données d'apprentissage ont déjà des étiquettes pour décrire leurs propriétés et leurs catégories.

Un autre type d'apprentissage automatique est appelé apprentissage automatique non supervisé. Il traite des données sans étiquette.

L'apprentissage automatique non supervisé prend des données brutes, et la machine les analyse essentiellement pour les caractéristiques et les regroupe par catégories. Il existe beaucoup de potentiel dans les deux types d’apprentissage automatique, mais il est plus facile de configurer un programme avec des données étiquetées pour un apprentissage automatique supervisé. L'apprentissage automatique non supervisé est une sorte d'eaux inconnues pour de nombreuses entreprises.

Voici quelques-unes des considérations que vous pouvez avoir et des idées fausses sur l'apprentissage automatique qui peuvent poser des problèmes d'adoption en entreprise. J'espère que cela a permis de dissiper une certaine confusion au sujet des projets d'apprentissage automatique.