Databricks einrichten - Kameleoon Documentation

Data-Warehouse-Integrationen sind als Premium-Add-on für unsere Module Web Experimentation und Feature Experimentation verfügbar. Für weitere Informationen wenden Sie sich bitte an Ihren Customer Success Manager.

Dieser Artikel erklärt, wie Sie eine Verbindung zu Ihrem Databricks SQL Warehouse einrichten. Er enthält mehrere Konfigurationsschritte, die in Ihrem Databricks-Konto durchgeführt werden müssen. Wir empfehlen, dass diese Schritte von Ihrem Databricks-Administrator durchgeführt werden. Mit der Databricks-Integration können Sie die Datenabfrage für gezielte Kampagnen und personalisierte Benutzererfahrungen vereinfachen. Wichtige Vorteile:

Ermöglicht eine präzise Datenerfassung und verbessert das Audience-Targeting für personalisierte Kampagnen, die auf die spezifischen Bedürfnisse der Zielgruppe zugeschnitten sind.
Versorgt Zielmetriken zur Verbesserung der Echtzeit-Leistungsverfolgung.

Hinweise

Beachten Sie diese Punkte bei der Verwendung dieser Integration:

Datenvolumen: Berücksichtigen Sie das Volumen der Daten, mit denen Sie interagieren möchten, da es die Abfrageleistung und -kosten beeinflussen kann.
Abfragekomplexität: Komplexe Abfragen können mehr Zeit und Ressourcen für die Ausführung erfordern. Optimieren Sie Ihre Abfragen für mehr Effizienz.
Datenschutz: Stellen Sie die Einhaltung von Datenschutzbestimmungen beim Umgang mit Benutzerdaten in Ihrem Warehouse sicher.
Zugriffskontrolle: Implementieren Sie angemessene Zugriffskontrollen, um zu beschränken, wer die Integration in Ihrer Organisation konfigurieren und verwenden kann.
Datenschema: Pflegen Sie ein klares und konsistentes Datenschema, um die Datenabfrage und -analyse zu erleichtern.
Monitoring: Überwachen Sie regelmäßig die Nutzung Ihres Data Warehouse, um Kosten und Leistung effektiv zu verwalten.
Dokumentation: Pflegen Sie eine Dokumentation für Abfragen, Konfigurationen und Integrationsprozesse, um die Zusammenarbeit und Fehlerbehebung zu erleichtern.

Voraussetzungen

Um diese Integration zu konfigurieren, benötigen Sie die folgenden Informationen:

Databricks Personal Access Token (PAT)
Entsprechenden Zugriff zum Erstellen eines Databricks-Schemas und zum Gewähren von Zugriffen.

Einrichtung

1. Ein Personal Access Token (PAT) erstellen

Kameleoon authentifiziert sich bei Ihrem Databricks SQL Warehouse mit einem Personal Access Token. Sie sollten ein Databricks Service Principal erstellen und dann ein PAT für dieses Service-Konto erstellen. Sobald ein Service Principal erstellt wurde, können Sie ein PAT mit der Databricks CLI generieren, indem Sie die „Application Id” des Service Principal verwenden, die Sie auf der Service Principal-Verwaltungsseite der Databricks-Benutzeroberfläche finden.

databricks token-management create-obo-token {Service Principal Application Id} --lifetime-seconds 7776000 --comment "Token for Kameleoon service principal"

2. Das Schema kameleoon_configuration erstellen

Bei Verwendung von Databricks als Quelle

Erstellen Sie ein dediziertes Schema für die Kameleoon-Polling-Konfiguration innerhalb des Catalogs, der die Daten enthält, die Kameleoon abfragen wird. Dieses Schema muss kameleoon_configuration heißen. Sie müssen außerdem dem Service Principal, den Kameleoon verwenden wird, Lese- und Schreibzugriff gewähren. Hier sind einige Beispielbefehle:

CREATE SCHEMA my_catalog.kameleoon_configuration;

GRANT CREATE TABLE ON SCHEMA my_catalog.kameleoon_configuration TO `{Service Principal Application Id}`;

GRANT SELECT ON SCHEMA my_catalog.kameleoon_configuration TO `{Service Principal Application Id}`;

Bei Verwendung von Databricks als Ziel:

CREATE SCHEMA my_catalog.kameleoon_configuration;

GRANT CREATE TABLE ON SCHEMA my_catalog.kameleoon_events TO `{Service Principal Application Id}`;

Wie in den obigen Befehlen müssen Sie {Service Principal Application Id} durch die Application Id Ihres Service Principals ersetzen.

Das Präfix my_catalog kann weggelassen werden, wenn Abfragen direkt im benötigten Catalog ausgeführt werden.

3. Lesezugriff auf Ihre Daten gewähren

Kameleoon muss Zugriff auf die Tabellen haben, aus denen Sie lesen oder in die Sie schreiben möchten. Dies kann mit Befehlen wie diesen erreicht werden: Bei Verwendung von Databricks als Quelle:

GRANT SELECT ON my_catalog.user_data.user_account_table TO `{Service Principal Application Id}`; // will grant read rights on a specific table

GRANT SELECT ON SCHEMA my_catalog.user_data TO `{Service Principal Application Id}`; // will grant read rights on all tables within a schema

Bei Verwendung von Databricks als Ziel:

GRANT INSERT ON SCHEMA my_catalog.kameleoon_events TO `{Service Principal Application Id}`; // will grant write rights on all tables within a schema

Hinweis: Das Präfix my_catalog kann weggelassen werden, wenn Abfragen direkt im benötigten Catalog ausgeführt werden.

4. Kameleoon-IPs autorisieren (Optional)

Wenn Sie IP-Zugriffslisten implementieren, wenden Sie sich an Ihren Kameleoon-Account-Manager, damit er Ihnen die Liste der Kameleoon-IPs zur Verfügung stellen kann, die Sie autorisieren müssen.

​Hinweise

​Voraussetzungen

​Einrichtung

​1. Ein Personal Access Token (PAT) erstellen

​2. Das Schema kameleoon_configuration erstellen

Bei Verwendung von Databricks als Quelle

​3. Lesezugriff auf Ihre Daten gewähren

​4. Kameleoon-IPs autorisieren (Optional)

Hinweise

Voraussetzungen

Einrichtung

1. Ein Personal Access Token (PAT) erstellen

2. Das Schema kameleoon_configuration erstellen

3. Lesezugriff auf Ihre Daten gewähren

4. Kameleoon-IPs autorisieren (Optional)