Databricksクラウドデータソース
この記事では、Databricksクラウドデータソースの構成方法について説明します。
Databricks クラウドデータソースは現在アーリーアクセス段階にあり、一部の選ばれたお客様のみご利用いただけます。Databricks をデータソースとして利用したい場合は、Tealium サポート担当者までご連絡ください。
クラウドデータソースの構成の概要については、クラウドデータソースについてを参照してください。
データタイプ
Databricksデータソースは、すべてのDatabricksデータタイプをサポートしています。データを正しくインポートするために、以下のガイドラインに従ってDatabricksデータタイプをマッピングしてください:
Databricks | Tealium |
---|---|
数値データタイプ | 数値属性 |
文字列およびバイナリデータタイプ | 文字列属性 |
論理データタイプ | ブール属性 |
日付および時間データタイプ | 日付属性 |
配列 | 文字列の配列、数値の配列、またはブールの配列 |
マップ、構造体、オブジェクト、バリアント | 文字列属性 |
詳細については、Databricks: データタイプ(AWS、Azure、GCP)を参照してください。
接続の作成
Tealiumはサービスプリンシパルを使用してDatabricksコンピュートリソースにアクセスします。進む前に、Databricksでサービスプリンシパルを作成し、OAuthシークレットを生成する必要があります。詳細については、Databricks: OAuthを使用してサービスプリンシパルでアクセスを認証するを参照してください。
新しい接続を構成するには、次の接続詳細を入力します:
- ホスト名: Databricksコンピュートリソースのホスト名。例:
- AWS:
MY_ACCOUNT.cloud.databricks.com
- Azure:
MY_ACCOUNT.azuredatabricks.net
- GCP:
MY_ACCOUNT.gcp.databricks.com
- AWS:
- HTTPパス: コンピュートリソースへのHTTPパス。例:
/sql/1.0/warehouses/3fbc78304284503a
。 - カタログ: この接続のカタログ名。
- スキーマ: この接続のスキーマ名。
- OAuthクライアントID: サービスプリンシパルのUUIDまたはアプリケーションID。
- OAuthクライアントシークレット: サービスプリンシパルが生成したシークレット。
詳細については、Databricks: コンピュート構成(AWS、Azure、GCP)を参照してください。
Databricksに接続した後、テーブル選択リストからデータソーステーブルを選択します。
クエリモード
一般的な概要については、クラウドデータソースについてを参照してください。
タイムスタンプ + インクリメントおよびタイムスタンプモードの場合、選択されたタイムスタンプ列はTIMESTAMP_NTZ
タイプでなければなりません。
詳細については、Databricks: TIMESTAMP_NTZ(AWS、Azure、GCP)を参照してください。
インクリメントモードの場合、選択された数値列は、追加されるたびに値が増加する必要があります。自動インクリメント列の推奨定義は次のとおりです:
COL1 BIGINT GENERATED ALWAYS AS IDENTITY (START WITH 1 INCREMENT BY 1)
詳細については、Databricks CREATE TABLE(AWS、Azure、GCP)を参照してください。
WHERE句
一般的な概要については、クラウドデータソースについてを参照してください。
WHERE
句は複数のテーブルからのサブクエリをサポートしていません。複数のDatabricksテーブルからデータをインポートするには、Databricksでビューを作成し、データソース構成でそのビューを選択してください。
詳細については、Databricks: ビューとは何か?(AWS、Azure、GCP)を参照してください。
IP許可リスト
DatabricksワークスペースがIPアドレスによって制限されている場合、Tealium IPアドレスをDatabricksのIPアクセスリストに追加してください。
詳細については、Databricks: IPアクセスリストの管理(AWS、Azure、GCP)を参照してください。
最終更新日 :: 2025年June月17日