Combien de fois ne vous est-il pas arrivé, sur un site marchand, de vous voir “pousser” pour la 2°, la 3° ou la 4° fois, le même produit que l’on vous avait déjà présenté et qui ne vous intéresse pas ?
Combien de fois, alors que vous cherchiez des pulls pour homme, n’avez-vous pas vu apparaître la fameuse zone “Les autres clients ont aussi aimé” avec… des leggings de sport pour femmes ?
N’avez-vous jamais été retargeté sur des articles de pêche car votre meilleur ami vous a montré, sur VOTRE tablette, la canne à pêche qu’il rêve de se voir offrir pour Noël… alors que vous détestez la pêche ?
La faute à qui ? Au prédictif. Derrière toutes ces approximations il y a un système probabiliste qui dit que:
- les 4 articles que l’on vous pousse pour la 3° fois, sont ceux qui ont la plus forte probabilité - rarement supérieure à 10% mais cela reste la plus forte - d’être achetés par les gens qui appartiennent au même segment que vous, sans se rendre compte que, vous, pas le segment mais vous, cela fait 3 fois que vous leur signifiez que ces articles ne vous intéressent pas.
- les visiteurs qui ont consulté des pulls (segment contextuel) ont aussi acheté des leggings pour femme, sans se rendre compte que dans le segment des visiteurs de pulls il y a aussi des femmes, qui venaient pour vous faire un cadeau et en ont profité pour acheter des vêtements féminins alors que vous vous êtes un homme.
- X% des gens qui ont consulté des cannes à pêche ont acheté des cannes à pêche sans se rendre compte que ce n’était pas vous qui consultait les cannes à pêche.
Ces quelques exemples mettent en lumière les principaux défauts des systèmes probabilistes pour l’interaction en temps réel et éclairent leur sous performance systématique.
Résumons-les.
1/ ils reposent sur les données du passé: quand vous entrez sur le site vous êtes rangé dans un segment qui a été modélisé sur des données constatées en amont de votre visite. La probabilité a été calculée sur des données passées. Ce qui s’est passé depuis cette modélisation n’est pas pris en compte. Ce que vous faites pendant votre navigation n’est pas pris en compte. On vous présente 4 fois les mêmes produits et à aucun moment vous ne cliquez sur aucun d’entre eux: vous avez clairement signifié votre manque d’intérêt. Un système différenciatif saurait l’identifier et s’adaptera en temps réel. Pas un système de machine learning car il applique un modèle pré-déterminé, purement intégratif et n’a pas la capacité à se remettre en cause en temps réel.
2/ ils travaillent par segment et non par individu: vous êtes “raccroché” (car pour interagir il faut bien vous “ranger” quelque part !) à un segment plus ou moins large qui se caractérise par le Plus Petit Dénominateur Commun et non par vos différences par rapport aux autres. Là où nous constatons 16.000 situations différentes utilisables tous les 1 million de visites, les systèmes de machine learning en proposent au mieux une douzaine… Comment voulez-vous que des segments de plusieurs dizaines de milliers d’individus avec lesquels vous avez un minimum de points communs rendent compte de ce qui vous intéresse vous et pas la moyenne ? C’est la raison pour laquelle ils génèrent un énorme volume de faux positifs. Quand vous dites que ce produit a 10% de chances d’être achetés cela signifie que 90% des gens à qui il sera exposé n’ont aucune chance de l’acheter… Un système capable d’auto-identifier, en temps réel, des milliers de situations est absolument nécessaire quand on veut personnaliser sa recommandation-produit.
3/ ils moyennent les résultats: comme le constate Dominique de la Roche dans un récent article publié sur Creéia “le machine learning se base sur la connaissance du passé (apprentissage) pour prendre ses décisions. C’est donc une approche «intégrative ». Et lorsqu’un cas particulier est rencontré dans les données d’entrées, celui-ci va avoir tendance à être moyenné et son effet deviendra souvent négligeable. C’est ce qui explique par exemple que dans les sites de e-commerce « censés » vous proposer des produits sur mesure, on remarque souvent qu’en réalité ces sites proposeront par exemple les mêmes produits si vous êtes deux hommes dans la même tranche d’âge. Les singularités des individus (même si on vous le fait croire) ne sont pas beaucoup prises en compte.” C’est l’histoire du modèle Ford de 4 places qui devait connaître un succès foudroyant - car 80% des familles américaines étaient composées de 4 personnes - et qui a été son échec le plus retentissant quand en fait la moitié étaient des familles de 3 et l’autre des familles de 5. Ces systèmes de machine learning ne peuvent trop souvent rendre compte que des phénomènes massifs. Justement ceux que vous êtes capables d’identifier sans eux. Ils ne rendront pas compte des milliers de situations différentes de vos visiteurs. Un processeur inductif, lui, ne cherchera pas à établir une probabilité mais une plausibilité en se “contentant” de recommander ce que les dernières personnes dans la même situation que le visiteur en cours ont acheté. Il ne poussera pas une "moyenne" de ce qui a été acheté hier mais la dernière tendance de ce qu'il aura observé se vendre aujourd’hui.
4/ les résultats sont peu fiables en l’absence d’un grand volume de données: quand on dit que ce produit à 11,5% de chances d’être acheté, cela ne traduit pas une réalité. En effet selon le volume de données qui aura été utilisé pour calculer la probabilité, l’écart type sera plus ou moins important. Et, par exemple, un écart type de 10% devrait imposer d’écrire cette probabilité de 11,5% de la manière suivante: entre 1,5 et 21,5% de probabilité d’être acheté. Ce n’est plus du tout la même chose car justement cet écart type ne vous apporte aucune garantie sur le fait que ce soit 1,5% ou 21,5%. Et cet écart type dépend du nombre d’occurrences qui ont été intégrées dans le calcul. Ce n’est pas pour rien que les sondages se font sur 800 personnes: c’est le volume d’occurrences dont les statisticiens calculent qu’il permet de produire une prédiction à peu près fiable avec un très faible écart type. Au fait, vous avez combien de produits sur votre site qui se vendent à plus de 800 exemplaires ?
5/ ils se contentent d’un cookie pour vous identifier: pour savoir comment vous identifier ils utilisent un cookie du type “identifiant unique de session”. Si c’est bien ce cookie qui s’active alors c’est bien vous ! Eh bien, non… Cela peut être cet ami fanatique de pêche à la mouche. Ou votre compagne, votre compagnon qui utilise votre PC. Oui, mais… dans ce cas on va identifier grâce au login / mot de passe. Si vous les saisissez, c’est bien vous ! Eh bien non… Au sein d’une même famille, nombreux sont ceux qui peuvent utiliser les mêmes identifiants pour un même site. Et puis, si vous deviez ne personnaliser que le parcours de ceux qui s’identifient à l’arrivée sur le site, vous ne personnaliseriez pas grand-chose. Ne riez pas, la plupart des solutions qui disent faire de la personnalisation marchent comme cela ! Donc quand ils vous ont “identifié” ils savent quoi vous dire même si ce n’est pas vous… D’où une recommandation de Justin Bieber qui fera suite à une longue visite de votre fille sur votre Mac quand votre génération vous fait plutôt préférer Led Zepp...Une solution inductive, qui aura pris la précaution de scinder en deux son modèle de données en distinguant la sphère d’activité (ce que vous faites maintenant) de la sphère d’affinité (ce que vous avez fait dans le passé) identifiera immédiatement la cohérence entre les deux. S’il y a cohérence, elle travaillera sur la base des deux. S’il y a incohérence elle travaillera exclusivement sur ce que vous faites à l’instant T. Et elle ne vous raccrochera pas immédiatement à un segment en fonction de ce qu’elle sait que vous avez fait hier...
Si vous rajoutez à cela que ces systèmes de machine learning sont dans l’immense majorité des cas purement contextuels et poussent les 3 produits les plus achetés par TOUS ceux qui ont visité CE produit, vous comprendrez mieux l’absence de pertinence que vous constatez très souvent sur les sites marchands.
Est-ce à dire que les systèmes prédictifs, le machine learning, sont invalides ? Non. Certainement pas. Ils s‘avèrent très efficients dans beaucoup de cas d’usage.
Quand vous travaillez dans le cadre d’un marketing par campagne, par exemple, et que vous préparez votre prochaine campagne d’emailing en cherchant à mettre en avant les produits qui auront la plus forte probabilité d’intéresser le destinataire en l’absence de données récentes sur lui.
Ou quand il s’agit d’émettre des hypothèses pour l’occupation à venir des lits de réanimation en cas de pandémie.
Mais pour les situations de vente, d’interaction en temps réel, dans lesquelles la compréhension pendant la navigation de ce qu’un individu recherche et l’identification de ce qui peut le satisfaire, un système inductif et différenciatif est sur-performant.
Nous en avons de nombreux exemples constatés à l’occasion d’A/B tests réalisés face à des outils de machine learning.
Pour n’en citer que deux:
- + 392% de CA/ visite sur l’un des plus grands sites français face à un leader mondial de la recommandation-produit,
- +55% de taux de clic sur l’un des principaux sites alimentaires britanniques face à un système de machine learning référent en Grande Bretagne.
Le processeur inductif travaille de manière différenciative, comme le vendeur en magasin. Et le vendeur en magasin n’a pas un tableur Excel en tête pour traiter des milliers de données.
Il sait faire la différence entre des situations et non raccrocher des individus à un segment.
Il sait identifier et reproduire ce qui a déjà marché dans cette situation et non appliquer la moyenne de ce qui a marché sur un segment dans le passé.
Alors, pour votre productivité commerciale, ne faites pas l’erreur de mettre un tableur excel dans votre site.
Mettez-y un système inductif qui reproduit la façon de travailler du vendeur en magasin: s’adapter en temps réel à chaque visiteur.
The Netwave Success Team
Nous espérons que cet article vous a intéressé. N’hésitez pas à le partager.
Nous vous donnons rendez-vous dans quelques jours pour décoder ensemble l’erreur N°8.
Vous avez un projet de personnalisation pour votre site e-commerce ? Demandez une demo de notre technologie de personnalisation.
Cette série vous intéresse ? Abonnez-vous au flux d’actualité Netwave, vous serez tenu au courant des nouvelles parutions.