Configurer Databricks - Kameleoon Documentation

Les intégrations data warehouse sont disponibles en tant que module complémentaire premium pour nos modules Web Experimentation et Feature Experimentation. Pour plus d’informations, veuillez contacter votre Customer Success Manager.

Cet article explique comment configurer une connexion à votre Databricks SQL warehouse. Il contient plusieurs étapes de configuration qui doivent être effectuées dans votre compte Databricks. Nous recommandons que ces étapes soient effectuées par votre administrateur Databricks. Avec l’intégration Databricks, vous pouvez simplifier la récupération des données pour des campagnes ciblées et des expériences utilisateur personnalisées. Principaux avantages :

Permet une collecte précise des données, améliorant le ciblage d’audience pour des campagnes personnalisées adaptées aux besoins spécifiques de l’audience.
Alimentez les métriques d’objectifs pour améliorer le suivi des performances en temps réel.

Considérations

Gardez ces éléments à l’esprit lors de l’utilisation de cette intégration :

Volume de données : Tenez compte du volume de données avec lequel vous prévoyez d’interagir, car cela peut affecter les performances et les coûts des requêtes.
Complexité des requêtes : Les requêtes complexes peuvent nécessiter plus de temps et de ressources pour s’exécuter. Optimisez vos requêtes pour plus d’efficacité.
Confidentialité des données : Assurez la conformité aux réglementations sur la confidentialité des données lors du traitement des données utilisateur dans votre warehouse.
Contrôle d’accès : Mettez en œuvre des contrôles d’accès appropriés pour limiter qui peut configurer et utiliser l’intégration au sein de votre organisation.
Schéma de données : Maintenez un schéma de données clair et cohérent pour faciliter la récupération et l’analyse des données.
Monitoring : Surveillez régulièrement l’utilisation de votre data warehouse pour gérer efficacement les coûts et les performances.
Documentation : Maintenez une documentation pour les requêtes, configurations et processus d’intégration afin de faciliter la collaboration et le dépannage.

Prérequis

Pour configurer cette intégration, vous avez besoin des informations suivantes :

Personal access token (PAT) Databricks
Accès approprié pour créer un schéma Databricks et accorder l’accès.

Configuration

1. Créer un personal access token (PAT)

Kameleoon s’authentifiera auprès de votre Databricks SQL warehouse avec un personal access token. Vous devez créer un service principal Databricks puis créer un PAT pour ce service account. Une fois un service principal créé, vous pouvez générer un PAT avec le Databricks CLI, en utilisant le « Application Id » du Service Principal que vous pouvez trouver dans la page de gestion des Service Principal de l’interface utilisateur Databricks.

databricks token-management create-obo-token {Service Principal Application Id} --lifetime-seconds 7776000 --comment "Token for Kameleoon service principal"

2. Créer le schéma kameleoon_configuration

Lors de l’utilisation de Databricks comme source

Créez un schéma dédié pour la configuration de polling Kameleoon au sein du catalog qui contient les données que Kameleoon interrogera. Ce schéma doit s’appeler kameleoon_configuration. Vous devez également accorder un accès en lecture et en écriture au Service Principal que Kameleoon utilisera. Voici quelques exemples de commandes :

CREATE SCHEMA my_catalog.kameleoon_configuration;

GRANT CREATE TABLE ON SCHEMA my_catalog.kameleoon_configuration TO `{Service Principal Application Id}`;

GRANT SELECT ON SCHEMA my_catalog.kameleoon_configuration TO `{Service Principal Application Id}`;

Lors de l’utilisation de Databricks comme destination :

CREATE SCHEMA my_catalog.kameleoon_configuration;

GRANT CREATE TABLE ON SCHEMA my_catalog.kameleoon_events TO `{Service Principal Application Id}`;

Comme dans les commandes ci-dessus, vous devrez remplacer {Service Principal Application Id} par l’application id de votre service principal.

Le préfixe my_catalog peut être omis lors de l’exécution de requêtes directement dans le catalog nécessaire.

3. Accorder l’accès en lecture à vos données

Kameleoon doit avoir accès aux tables dans lesquelles vous souhaitez lire ou écrire. Cela peut être réalisé avec des commandes telles que : Utilisation de Databricks comme source :

GRANT SELECT ON my_catalog.user_data.user_account_table TO `{Service Principal Application Id}`; // will grant read rights on a specific table

GRANT SELECT ON SCHEMA my_catalog.user_data TO `{Service Principal Application Id}`; // will grant read rights on all tables within a schema

Utilisation de Databricks comme destination :

GRANT INSERT ON SCHEMA my_catalog.kameleoon_events TO `{Service Principal Application Id}`; // will grant write rights on all tables within a schema

Note : Le préfixe my_catalog peut être omis lors de l’exécution de requêtes directement dans le catalog nécessaire.

4. Autoriser les IPs Kameleoon (Optionnel)

Si vous implémentez des IP access lists, contactez votre account manager Kameleoon, afin qu’il puisse vous fournir la liste des IPs Kameleoon que vous devez autoriser.

​Considérations

​Prérequis

​Configuration

​1. Créer un personal access token (PAT)

​2. Créer le schéma kameleoon_configuration

Lors de l’utilisation de Databricks comme source

​3. Accorder l’accès en lecture à vos données

​4. Autoriser les IPs Kameleoon (Optionnel)

Considérations

Prérequis

Configuration

1. Créer un personal access token (PAT)

2. Créer le schéma kameleoon_configuration

3. Accorder l’accès en lecture à vos données

4. Autoriser les IPs Kameleoon (Optionnel)