Databricksクラウドデータソース
この記事では、Databricksクラウドデータソースの構成方法について説明します。
クラウドデータソースの構成の一般的な概要については、クラウドデータソースの管理を参照してください。
データタイプ
Databricksデータソースは、すべてのDatabricksデータタイプをサポートしています。データが正しくインポートされるように、以下のガイドラインに従ってDatabricksデータタイプをマッピングしてください:
| Databricks | Tealium |
|---|---|
| 数値データタイプ | 数値属性 |
| 文字列およびバイナリデータタイプ | 文字列属性 |
| 論理データタイプ | ブール属性 |
| 日付および時間データタイプ | 日付属性 |
| 配列 | 文字列の配列、数値の配列、またはブールの配列 |
| マップ、構造体、オブジェクト、バリアント | 文字列属性 |
詳細については、Databricks: データタイプ (AWS, Azure, GCP)を参照してください。
マルチテーブル結合は現在サポートされていません。同じ機能はDatabricksビューで実現できます。詳細については、Databricks: ビューの作成と管理 (AWS, Azure, GCP)を参照してください。
接続の作成
Tealiumはサービスプリンシパルを使用してDatabricksコンピュートリソースにアクセスします。進む前に、Databricksでサービスプリンシパルを作成し、OAuthシークレットを生成する必要があります。詳細については、Databricks: OAuthを使用してサービスプリンシパルでアクセスを認証するを参照してください。
Databricks個人アクセストークン(PAT)はサポートされていません。詳細については、Databricks: Databricks個人アクセストークンで認証する(レガシー) (AWS, Azure, GCP)を参照してください。
新しい接続を構成するには、次の接続詳細を入力します:
- ホスト名: Databricksコンピュートリソースのホスト名。例:
- AWS:
MY_ACCOUNT.cloud.databricks.com - Azure:
MY_ACCOUNT.azuredatabricks.net - GCP:
MY_ACCOUNT.gcp.databricks.com
- AWS:
- HTTPパス: コンピュートリソースへのHTTPパス。例:
/sql/1.0/warehouses/3fbc78304284503a。HTTPパスを見つけるには、DatabricksでSQL Warehouses画面に移動し、テーブルが配置されている倉庫を選択し、接続詳細をクリックします。 - カタログ: この接続のカタログ名。
- スキーマ: この接続のスキーマ名。
- OAuthクライアントID: サービスプリンシパルのUUIDまたはアプリケーションID。
- OAuthクライアントシークレット: サービスプリンシパルが生成したシークレット。
詳細については、Databricks: コンピュート構成 (AWS, Azure, GCP)を参照してください。
Databricksに接続した後、テーブル選択リストからデータソーステーブルを選択します。
クエリモード
一般的な概要については、クラウドデータソースについてを参照してください。
Databricksについては、次の要件に注意してください:
- タイムスタンプ + インクリメントおよびタイムスタンプモード:選択されたタイムスタンプ列は
TIMESTAMPタイプでなければなりません。 詳細については、Databricks: TIMESTAMPタイプ (AWS, Azure, GCP)を参照してください。 - インクリメントモード:選択された数値列は、追加されるたびに値が増加する必要があります。自動インクリメント列の推奨定義は次のとおりです:
COL1 BIGINT GENERATED ALWAYS AS IDENTITY (START WITH 1 INCREMENT BY 1)
詳細については、Databricks CREATE TABLE (AWS, Azure, GCP)を参照してください。
WHERE句
一般的な概要については、クラウドデータソースについてを参照してください。
WHERE句は複数のテーブルからのサブクエリをサポートしていません。複数のDatabricksテーブルからデータをインポートするには、Databricksでビューを作成し、データソース構成でビューを選択します。
詳細については、Databricks: ビューとは何か? (AWS, Azure, GCP)を参照してください。
IPアクセスリスト
DatabricksワークスペースがIPアドレスによって制限されている場合は、Tealium IPアドレスをDatabricksのIPアクセスリストに追加してください。
詳細については、Databricks: IPアクセスリストの管理 (AWS, Azure, GCP)を参照してください。
最終更新日 :: 2026年January月20日