Saltar al contenido principal
Kameleoon ofrece dos tipos de algoritmos de asignación dinámica de tráfico para ayudar a maximizar el rendimiento de los experimentos: multi-armed bandits (MAB) y contextual bandits. Ambos enfoques utilizan datos de rendimiento en tiempo real para asignar más tráfico a las variaciones con mejor rendimiento, pero difieren en cómo tratan los datos del usuario. Este artículo explica cómo funcionan estos algoritmos, cuándo utilizarlos y cómo activarlos en sus experimentos. Para habilitar la asignación dinámica de tráfico, cree un nuevo experimento o abra uno existente.
En la sección Variation to serve, seleccione la asignación preferida en el menú desplegable. Elija entre la optimización Multi-armed bandit o Contextual bandit.
Kameleoon actualiza la asignación basándose únicamente en el lift del goal principal.

Multi-armed bandits

Cuando se utiliza la asignación dinámica (como los MAB), no se pueden editar manualmente las tasas de exposición. En su lugar, Kameleoon mide automáticamente la mejora respecto a la variación original y estima la ganancia en conversiones totales mediante el algoritmo Epsilon Greedy. Kameleoon repite este proceso cada hora. El algoritmo MAB redirige el tráfico a las variaciones con mejor rendimiento, incluso sin significancia estadística, lo que puede reducir drásticamente el tiempo necesario para identificar variaciones ganadoras o perdedoras.
Los experimentos autooptimizados se basan en la variación original (“off” para los Feature Experiments) para optimizar las desviaciones. Si la variación original no recibe tráfico, la desviación podría no actualizarse, lo que provocaría que la asignación se mantuviera en 50/50 a pesar de existir una variación claramente ganadora.
Los MAB no dependen de una experiencia de control o baseline. A diferencia de los tests A/B, los MAB dan prioridad a la mejora respecto a una asignación inicial equitativa y ajustan dinámicamente el tráfico en función del rendimiento en tiempo real. En los casos en que el análisis estadístico es menos importante y debe minimizar el tiempo de «exploración», los MAB son útiles porque se centran más en la «explotación».

Contextual bandits

Los contextual bandits optimizan dinámicamente la asignación de tráfico en los experimentos utilizando aprendizaje automático. Se adaptan en tiempo real para redistribuir el tráfico en función del rendimiento de las variaciones y del contexto del usuario, a fin de maximizar la efectividad. Varias diferencias clave distinguen a los multi-armed bandits de los contextual bandits:
  • Multi-armed bandits: optimizan la distribución del tráfico entre varias variaciones (brazos) para maximizar un goal definido, como las tasas de clic o las conversiones. Tratan a todos los usuarios por igual, sin distinguir por atributos de usuario. Esto los hace ideales para situaciones en las que los datos específicos del usuario no están disponibles o no son necesarios, y el foco se mantiene en encontrar la variación con mejor rendimiento para la audiencia global.
  • Contextual bandits: incorporan datos adicionales específicos del usuario —como el tipo de dispositivo, la ubicación o el comportamiento— en la toma de decisiones. Facilitan decisiones más personalizadas al adaptar las variaciones a usuarios concretos para obtener mejores resultados. La variabilidad introducida por los atributos del usuario permite a los contextual bandits optimizar las decisiones en entornos dinámicos.
Mientras que los multi-armed bandits optimizan la asignación de tráfico de manera uniforme entre los usuarios, los contextual bandits aprovechan los datos contextuales para tomar decisiones más personalizadas y basadas en datos. Lea el artículo Dynamic traffic allocation para obtener más información sobre cómo funciona la optimización MAB, o consulte el documento estadístico de Kameleoon para profundizar en los detalles técnicos del algoritmo MAB.