
Kameleoon met à jour l’allocation uniquement en fonction du lift de l’objectif principal.
Multi-armed bandits
Lors de l’utilisation d’une allocation dynamique (comme les MABs), vous ne pouvez pas modifier manuellement les taux d’exposition. Au lieu de cela, Kameleoon mesure automatiquement l’amélioration par rapport à la variation originale et estime le gain en conversions totales à l’aide de l’algorithme Epsilon Greedy. Kameleoon répète ce processus toutes les heures. L’algorithme MAB redirige le trafic vers les variations les plus performantes, même sans signification statistique, ce qui peut réduire considérablement le temps nécessaire pour identifier les variations gagnantes ou perdantes.Les expériences auto-optimisées s’appuient sur la variation originale (“off” pour les Feature Experiments) pour optimiser les déviations. Si la variation originale ne reçoit pas de trafic, la déviation peut ne pas se mettre à jour, faisant en sorte que l’allocation reste à 50/50 malgré une variation gagnante évidente.
Contextual bandits
Les contextual bandits optimisent dynamiquement l’allocation du trafic dans les expériences à l’aide du machine learning. Ils s’adaptent en temps réel pour redistribuer le trafic en fonction de la performance des variations et du contexte utilisateur afin de maximiser l’efficacité. Des différences clés distinguent les multi-armed bandits des contextual bandits :- Multi-armed bandits : Ceux-ci optimisent la distribution du trafic entre plusieurs variations (bras) pour maximiser un objectif défini, comme les taux de clics ou les conversions. Ils traitent tous les utilisateurs de la même manière, sans distinction basée sur les attributs des utilisateurs. Cela les rend idéaux pour les scénarios où les données spécifiques aux utilisateurs ne sont pas disponibles ou nécessaires, et où l’accent reste sur la recherche de la variation la plus performante pour l’audience globale.
- Contextual bandits : Ceux-ci intègrent des données supplémentaires spécifiques aux utilisateurs — telles que le type d’appareil, la localisation ou le comportement — dans la prise de décision. Ils facilitent des décisions plus personnalisées en adaptant les variations à des utilisateurs spécifiques pour de meilleurs résultats. La variabilité introduite par les attributs utilisateurs permet aux contextual bandits d’optimiser les décisions dans des environnements dynamiques.