L'apprentissage par renforcement peut donner une belle dynamique au marketing

Auteur: Roger Morrison
Date De Création: 1 Septembre 2021
Date De Mise À Jour: 1 Juillet 2024
Anonim
L'apprentissage par renforcement peut donner une belle dynamique au marketing - La Technologie
L'apprentissage par renforcement peut donner une belle dynamique au marketing - La Technologie

Contenu



Source: Juliatimchenko / Dreamstime.com

À emporter:

L'apprentissage par renforcement est un sous-ensemble de l'intelligence artificielle et de l'apprentissage automatique qui peut prévoir les résultats et aider les utilisateurs à prendre de meilleures décisions.

Les spécialistes du marketing recherchent en permanence des solutions évolutives et intelligentes lorsqu'ils tentent de se démarquer dans des conditions de marché de plus en plus concurrentielles. Il n’est pas surprenant que l’intelligence artificielle (IA) et l’apprentissage automatique (ML) soient maintenant adoptés en masse par les marques et leurs organisations de marketing. (Pour en savoir plus sur les bases de ML, consultez Machine Learning 101.)

Pour les non-initiés, l'intelligence artificielle peut généralement être considérée comme une technologie lorsqu'un ordinateur automatise les tâches définies qu'un humain aurait autrement. L'apprentissage automatique, en tant que domaine fonctionnel de l'intelligence artificielle, consiste à donner à un ordinateur un objectif final tout en lui permettant de calculer lui-même le meilleur itinéraire.


Aujourd'hui, nous voyons ces technologies, notamment l'apprentissage automatique, déployées dans de nombreux domaines du marketing, notamment la détection des fraudes publicitaires, la prévision du comportement des consommateurs, les systèmes de recommandation, la personnalisation créative, etc.

Bien que ce soit très bien, il existe une nouvelle technologie qui, pour les spécialistes du marketing, répondra réellement à la demande créée par l’apprentissage automatique. On l’appelle «apprentissage par renforcement» (RL).

Qu'est-ce que l'apprentissage par renforcement?

Le passage progressif de ML à RL est plus qu'une simple lettre. La plupart des tâches confiées à l'apprentissage automatique impliquent l'utilisation d'une seule étape, telle que "reconnaître cette image", "comprendre le contenu du livre" ou "attraper une fraude". Pour un spécialiste du marketing, un objectif commercial tel que "attirer, fidéliser et engager les utilisateurs" est: Par nature, il s’agit d’un processus à plusieurs étapes et à long terme, difficile à réaliser avec l’apprentissage automatique.


C’est là que l’apprentissage par renforcement entre en jeu. Les algorithmes RL ont pour objectif l’optimisation pour un parcours sans cesse évolutif et en perpétuel changement, caractérisé par des problèmes dynamiques. En utilisant une «fonction de récompense» mathématique pour calculer le résultat de chaque permutation, RL peut voir l’avenir et faire le bon choix.

Aujourd'hui, les meilleurs modes de réalisation de cette technologie de pointe sont visibles dans les jeux et les voitures autonomes. Lorsque le système AlphaGo de Google a battu le meilleur joueur du monde du jeu de société Go l’an dernier, leur secret était l’apprentissage par renforcement. Alors que les jeux ont défini des règles, les options du joueur pour choisir son chemin vers la victoire changent de manière dynamique en fonction de l’état du tableau. Avec l'apprentissage par renforcement, le système tient compte de toutes les permutations possibles qui pourraient changer en fonction de chaque déplacement.

De la même manière, une voiture autonome effectue un trajet dans lequel les règles de la route et la localisation de la destination restent fixes, mais les variables en cours de route - des piétons aux barrages routiers des cyclistes - changent de manière dynamique. C’est pourquoi OpenAI, l’organisation fondée par Elon Musk de Tesla, utilise des algorithmes RL avancés pour ses véhicules.

Pas de bugs, pas de stress - Votre guide étape par étape pour créer un logiciel qui change la vie sans vous détruire


Vous ne pouvez pas améliorer vos compétences en programmation lorsque personne ne se soucie de la qualité des logiciels.

Machines pour le marketing

Qu'est-ce que tout cela signifie pour les spécialistes du marketing?

Les principaux défis des spécialistes du marketing sont dus au fait que la situation de l’entreprise change constamment. Une stratégie de campagne gagnante peut devenir défavorable avec le temps, alors qu'une stratégie ancienne peut gagner en puissance. RL est un pas en avant pour imiter la véritable intelligence humaine où nous apprenons du succès et / ou de l'échec de multiples résultats et formons une stratégie gagnante pour l'avenir. Me laisser donner quelques exemples:

1. Amélioration de l'engagement de l'utilisateur

Concentrons-nous sur l’engagement des clients pour une chaîne de restaurants et visons à le multiplier par 10 au cours de la prochaine année. Aujourd’hui, une campagne de marketing peut impliquer des vœux d’anniversaire avec une offre de réduction, peut-être même en fonction des préférences alimentaires. C’est une pensée linéaire où l’agent de commercialisation a défini un point de départ et un point final.

Dans un monde occupé, la vie des clients change constamment en temps réel - parfois ils sont plus engagés, parfois moins. Dans l'apprentissage par renforcement, un système recalibrerait constamment quelle tactique de l'arsenal marketing offrirait, à tout moment, les meilleures chances d'amener le destinataire à atteindre l'objectif ultime de l'engagement 10x.

2. Allocation budgétaire dynamique

Imaginez maintenant un scénario publicitaire dans lequel vous disposiez d’un budget d’un million de dollars et que vous deviez dépenser chaque jour jusqu’à la fin du mois, répartis sur quatre chaînes différentes: la télévision, les promotions de fidélisation et Google. Comment pouvez-vous vous assurer que vous dépensez votre budget de la manière la plus optimale? La réponse dépend du jour, des utilisateurs cibles, du prix des stocks et d'une foule d'autres facteurs.

Dans l'apprentissage par renforcement, les algorithmes utilisent des données historiques sur les résultats des annonces pour écrire des fonctions de récompense qui marquent certaines décisions de dépenses. Mais cela tient également compte de facteurs en temps réel tels que la tarification et la probabilité d'une réception positive de la part du membre du public cible. Grâce à l'apprentissage itératif, l'allocation des dépenses publicitaires tout au long du mois changerait de manière dynamique. Bien que l'objectif ultime soit fixé, RL aura alloué le budget de la meilleure façon possible dans tous les scénarios. (Pour plus d'informations sur l'IA dans le marketing, voir En quoi l'intelligence artificielle va-t-elle révolutionner le secteur de la vente?)

Bientôt disponible

L'apprentissage par renforcement reconnaît la complexité et reconnaît que les personnes sont hétérogènes et rend compte de ces vérités, améliorant chaque action suivante au fil du temps, à mesure que les éléments de votre jeu changent.

L'apprentissage par renforcement est encore largement l'apanage des projets de recherche et des adoptants de pointe. Le concept et la technique des mathématiques existent depuis plus de 40 ans, mais leur déploiement n’a été possible que récemment, grâce à trois tendances:

  1. Prolifération de la puissance de calcul grâce à des unités de traitement graphique (GPU) de grande puissance.

  2. Le cloud computing permet de disposer d'une puissance de processeur haut de gamme pour une fraction du coût d'achat des GPU eux-mêmes, permettant ainsi à des tiers de louer un GPU pour former leur modèle RL pendant plusieurs heures, jours ou semaines à un prix relativement avantageux.

  3. Amélioration des algorithmes numériques ou des méthodes heuristiques intelligentes. Quelques étapes numériques critiques dans un algorithme RL sont maintenant capables de converger à un rythme beaucoup plus rapide. Sans ces astuces numériques magiques, elles ne seraient toujours pas réalisables, même avec les ordinateurs les plus puissants d’aujourd’hui.

Penser plus grand

Tout cela signifie que les nouvelles puissances de l'apprentissage par renforcement vont bientôt être disponibles à grande échelle pour les marques et les commerçants. Cependant, adopter une telle attitude nécessitera un changement de mentalité. Pour un responsable marketing, cette technologie signifie la possibilité de se libérer du volant.

Chaque entreprise a un objectif, mais lorsque vous vous trouvez au plus profond de la tranchée, les actions quotidiennes entreprises dans ce sens peuvent devenir floues. Désormais, la technologie RL permettra aux décideurs de définir l’objectif, en ayant l’assurance que les systèmes traceront leur meilleur chemin vers cet objectif.

Dans la publicité, par exemple, de nos jours, de nombreuses personnes réalisent que des métriques telles que le taux de clics (CTR) ne sont que des approximations des résultats réels, uniquement parce qu'elles sont comptabilisables. Les systèmes de marketing pilotés par RL minimiseront l'importance de ces métriques intermédiaires et de tout le lourd travail qui leur est associé, permettant ainsi aux patrons de se concentrer sur leurs objectifs.

Pour ce faire, les entreprises devront réfléchir à leurs gros problèmes de manière beaucoup plus proactive et à long terme. Lorsque la technologie sera mature, ils atteindront leur objectif.

Chemin vers l'adoption

L’apprentissage par renforcement n’est pas encore prêt pour une utilisation à grande échelle par les marques; Cependant, les spécialistes du marketing devraient prendre le temps de comprendre ce nouveau concept qui pourrait révolutionner la manière dont les marques procèdent au marketing, en réalisant certaines des premières promesses de l'apprentissage automatique.

Lorsque le pouvoir arrivera, il entrera dans un logiciel de marketing avec une interface utilisateur, mais les tâches requises par ce logiciel seront radicalement simplifiées. Pour le personnel, il y aura moins de commutateurs mobiles et de nombres entrés, ainsi que moins de lectures de rapports analytiques et d’agissements correspondants. Derrière le tableau de bord, l'algorithme se chargera de la majeure partie de cette tâche.

Il est peu probable que RL puisse rivaliser avec l'intelligence humaine dès le départ. La rapidité de son développement dépendrait des commentaires et des suggestions des spécialistes du marketing. Nous devons nous assurer que nous demandons à un ordinateur de résoudre le bon problème et de le pénaliser s'il ne le fait pas. On dirait que vous enseigneriez à votre propre enfant, n’est-ce pas?