Optimisations multi-armed bandit pour les expériences de feature

Kameleoon propose deux types d’algorithmes d’allocation dynamique du trafic pour aider à maximiser la performance des expériences : les multi-armed bandits (MABs) et les contextual bandits. Les deux approches utilisent les données de performance en temps réel pour allouer plus de trafic aux variations les plus performantes, mais diffèrent dans la façon dont elles traitent les données utilisateurs. Cet article explique comment ces algorithmes fonctionnent, quand les utiliser et comment les activer dans vos expériences. Pour activer l’allocation dynamique du trafic, créez une nouvelle expérience ou ouvrez-en une existante.

Dans la section Variation to serve, sélectionnez l’allocation préférée dans le menu déroulant. Choisissez entre l’optimisation Multi-armed bandit ou Contextual bandit.

Kameleoon met à jour l’allocation uniquement en fonction du lift de l’objectif principal.

Multi-armed bandits

Lors de l’utilisation d’une allocation dynamique (comme les MABs), vous ne pouvez pas modifier manuellement les taux d’exposition. Au lieu de cela, Kameleoon mesure automatiquement l’amélioration par rapport à la variation originale et estime le gain en conversions totales à l’aide de l’algorithme Epsilon Greedy. Kameleoon répète ce processus toutes les heures. L’algorithme MAB redirige le trafic vers les variations les plus performantes, même sans signification statistique, ce qui peut réduire considérablement le temps nécessaire pour identifier les variations gagnantes ou perdantes.

Les expériences auto-optimisées s’appuient sur la variation originale (“off” pour les Feature Experiments) pour optimiser les déviations. Si la variation originale ne reçoit pas de trafic, la déviation peut ne pas se mettre à jour, faisant en sorte que l’allocation reste à 50/50 malgré une variation gagnante évidente.

Les MABs ne reposent pas sur une expérience de contrôle ou de référence. Contrairement aux A/B tests, les MABs privilégient l’amélioration par rapport à une allocation initialement égale et ajustent dynamiquement le trafic en fonction des performances en temps réel. Dans les cas où l’analyse statistique est moins importante et où vous devez minimiser le temps d’« exploration », les MABs sont utiles car ils se concentrent davantage sur l’« exploitation ».

Contextual bandits

Les contextual bandits optimisent dynamiquement l’allocation du trafic dans les expériences à l’aide du machine learning. Ils s’adaptent en temps réel pour redistribuer le trafic en fonction de la performance des variations et du contexte utilisateur afin de maximiser l’efficacité. Des différences clés distinguent les multi-armed bandits des contextual bandits :

Multi-armed bandits : Ceux-ci optimisent la distribution du trafic entre plusieurs variations (bras) pour maximiser un objectif défini, comme les taux de clics ou les conversions. Ils traitent tous les utilisateurs de la même manière, sans distinction basée sur les attributs des utilisateurs. Cela les rend idéaux pour les scénarios où les données spécifiques aux utilisateurs ne sont pas disponibles ou nécessaires, et où l’accent reste sur la recherche de la variation la plus performante pour l’audience globale.
Contextual bandits : Ceux-ci intègrent des données supplémentaires spécifiques aux utilisateurs — telles que le type d’appareil, la localisation ou le comportement — dans la prise de décision. Ils facilitent des décisions plus personnalisées en adaptant les variations à des utilisateurs spécifiques pour de meilleurs résultats. La variabilité introduite par les attributs utilisateurs permet aux contextual bandits d’optimiser les décisions dans des environnements dynamiques.

Tandis que les multi-armed bandits optimisent l’allocation du trafic de manière uniforme entre les utilisateurs, les contextual bandits exploitent les données contextuelles pour prendre des décisions plus personnalisées et data-driven. Lisez l’article Dynamic traffic allocation pour en savoir plus sur le fonctionnement de l’optimisation MAB, ou lisez le Kameleoon statistical paper pour approfondir les détails techniques de l’algorithme MAB.

Accueil

Démarrer

Expérimentation

Web Personalization

Ciblage produit et preuve sociale

Recommandations et merchandising

Analytique des expériences

Assistant IA

Détection d'opportunités par IA

Ciblage prédictif par IA

Ressources

Gestion des comptes et des équipes

Gestion de projet

FAQ

Optimisations multi-armed bandit pour les expériences de feature

Multi-armed bandits

Contextual bandits

​Multi-armed bandits

​Contextual bandits

Multi-armed bandits

Contextual bandits