Databricks Delta Sharing クラウドデータソース
この記事では、Databricks Delta Sharing クラウドデータソースの構成方法について説明します。
Databricks Delta Sharing クラウドデータソースは現在アーリーアクセス中で、選ばれた顧客のみが利用可能です。Databricks Delta Sharing を始めるには、Tealium サポートに連絡してください。
クラウドデータソースの構成に関する一般的な概要については、クラウドデータソースの管理を参照してください。
動作原理
Databricks Delta Sharing クラウドデータソースは、Databricks 間でデータ資産を安全に共有する Databricks-to-Databricks 共有プロトコルを使用します。
このプロトコルでは、あなたが提供者であり、Tealium が受信者です。Databricks で共有を作成し、それらの共有に対して Tealium へのアクセスを許可します。共有は読み取り専用のテーブルや資産のコレクションです。
Databricks で Tealium 共有識別子(メタストア ID)を使用して Tealium への安全な接続を構成します。データベースのユーザー名、パスワード、アクセストークンは Databricks を離れることはありません。
CloudStream と一緒に使用する場合、データパイプラインはゼロコピーです。データは Databricks 環境内に留まり、オンデマンドでアクティベーションのためにアクセスされます。
データタイプ
Databricks Delta Sharing データソースは、すべての Databricks データタイプをサポートしています。データが正しくインポートされるように、以下のガイドラインに従って Databricks データタイプをマッピングしてください:
| Databricks | Tealium |
|---|---|
| 数値データタイプ | 数値属性 |
| 文字列およびバイナリデータタイプ | 文字列属性 |
| 論理データタイプ | ブール属性 |
| 日付および時間データタイプ | 日付属性 |
| 配列 | 文字列の配列、数値の配列、またはブールの配列 |
| マップ、構造体、オブジェクト、バリアント | 文字列属性 |
詳細については、Databricks: データタイプ (AWS, Azure, GCP) を参照してください。
接続の作成
Delta Sharing を構成するためには、ユーザーは Databricks Unity Catalog の CREATE RECIPIENT, CREATE SHARE, USE CATALOG, USE SCHEMA, SELECT の権限が必要です。メタストア管理者はこれらの権限を既に持っています。
Databricks Delta Sharing との接続を作成するには、Databricks で次の手順を完了します:
- データを共有したいメタストアが含まれている Databricks Unity Catalog で Delta Sharing を有効にします。 詳細については、Databricks: メタストアでの Delta Sharing の有効化 (AWS, Azure, GCP) を参照してください。
- Tealium と共有する予定のテーブル、ビュー、またはカタログで共有を作成します。 詳細については、Databricks: Delta Sharing の共有の作成と管理 (AWS, Azure, GCP) を参照してください。
- 受信者を作成します。Tealium 受信者を作成するために必要な
metastore_idを取得するには、Tealium サポートに連絡してください。 詳細については、Databricks: Delta Sharing のデータ受信者の作成と管理 (Databricks-to-Databricks 共有) (AWS, Azure, GCP) を参照してください。 - Tealium に一つ以上の共有へのアクセスを許可します。 詳細については、Databricks: Delta Sharing データ共有へのアクセスの管理 (提供者用) (AWS, Azure, GCP) を参照してください。
- Tealium サポートに連絡して、接続を作成してもらいます。接続を作成するためには、Tealium サポートがあなたの Databricks ワークスペース名を必要とします。
Tealium で Databricks Delta Sharing クラウドデータソースを作成するための次の手順を完了します:
- Tealium サポートが接続を作成した後、Tealium で Databricks Delta Sharing クラウドデータソースを作成します。詳細については、クラウドデータソースの管理を参照してください。
- 接続の確立をクリックします。Databricks への Delta Sharing 接続の確立には最大で2-3分かかる場合があります。
- Databricks Delta Sharing に接続した後、テーブル選択リストからデータソーステーブルを選択します。
マルチテーブル結合はサポートされていません。同じ機能を実現するには、Databricks ビューを使用します。詳細については、Databricks: ビューの作成と管理 (AWS, Azure, GCP) を参照してください。
クエリモード
一般的な概要については、クラウドデータソースについてを参照してください。
Databricks Delta Sharing の場合、以下の要件に注意してください:
- タイムスタンプ + インクリメントおよびタイムスタンプモード:選択されたタイムスタンプ列は
TIMESTAMPタイプでなければなりません。 詳細については、Databricks: TIMESTAMP タイプ (AWS, Azure, GCP) を参照してください。 - インクリメントモード:選択された数値列は、追加される各行に対して値が増加する必要があります。自動インクリメント列の推奨定義は次のとおりです:
COL1 BIGINT GENERATED ALWAYS AS IDENTITY (START WITH 1 INCREMENT BY 1)
詳細については、Databricks CREATE TABLE (AWS, Azure, GCP) を参照してください。
WHERE 句
一般的な概要については、クラウドデータソースについてを参照してください。
WHERE 句は複数のテーブルからのサブクエリをサポートしていません。複数の Databricks テーブルからデータをインポートするには、Databricks でビューを作成し、データソース構成でビューを選択します。
詳細については、Databricks: ビューとは何か? (AWS, Azure, GCP) を参照してください。
IP アクセスリスト
Databricks ワークスペースが IP アドレスによって制限されている場合は、Tealium IP アドレス を Databricks の IP アクセスリストに追加してください。
詳細については、Databricks: IP アクセスリストの管理 (AWS, Azure, GCP) を参照してください。
最終更新日 :: 2026年March月18日