
Kameleoon actualiza la asignación basándose únicamente en el lift del goal principal.
Multi-armed bandits
Cuando se utiliza la asignación dinámica (como los MAB), no se pueden editar manualmente las tasas de exposición. En su lugar, Kameleoon mide automáticamente la mejora respecto a la variación original y estima la ganancia en conversiones totales mediante el algoritmo Epsilon Greedy. Kameleoon repite este proceso cada hora. El algoritmo MAB redirige el tráfico a las variaciones con mejor rendimiento, incluso sin significancia estadística, lo que puede reducir drásticamente el tiempo necesario para identificar variaciones ganadoras o perdedoras.Los experimentos autooptimizados se basan en la variación original (“off” para los Feature Experiments) para optimizar las desviaciones. Si la variación original no recibe tráfico, la desviación podría no actualizarse, lo que provocaría que la asignación se mantuviera en 50/50 a pesar de existir una variación claramente ganadora.
Contextual bandits
Los contextual bandits optimizan dinámicamente la asignación de tráfico en los experimentos utilizando aprendizaje automático. Se adaptan en tiempo real para redistribuir el tráfico en función del rendimiento de las variaciones y del contexto del usuario, a fin de maximizar la efectividad. Varias diferencias clave distinguen a los multi-armed bandits de los contextual bandits:- Multi-armed bandits: optimizan la distribución del tráfico entre varias variaciones (brazos) para maximizar un goal definido, como las tasas de clic o las conversiones. Tratan a todos los usuarios por igual, sin distinguir por atributos de usuario. Esto los hace ideales para situaciones en las que los datos específicos del usuario no están disponibles o no son necesarios, y el foco se mantiene en encontrar la variación con mejor rendimiento para la audiencia global.
- Contextual bandits: incorporan datos adicionales específicos del usuario —como el tipo de dispositivo, la ubicación o el comportamiento— en la toma de decisiones. Facilitan decisiones más personalizadas al adaptar las variaciones a usuarios concretos para obtener mejores resultados. La variabilidad introducida por los atributos del usuario permite a los contextual bandits optimizar las decisiones en entornos dinámicos.