クラウドデータソースについて
この記事では、クラウドデータウェアハウスまたはデータベースからデータをインポートする方法について説明します。
要件
この機能には以下が必要です:
- Tealium EventStream、Tealium AudienceStream、または Tealium CloudStream
サポートされているベンダー
クラウドデータソースの構成は、ほぼすべてのベンダーで同じです。概要については、クラウドデータソースの管理を参照してください。
ベンダー固有の構成の詳細については、以下を参照してください:
動作方法
クラウドデータソースは、クラウドデータウェアハウスまたはデータベースをTealiumに接続し、イベントとしてデータをインポートすることができます。このプロセスにはいくつかの重要なコンポーネントが含まれます:
- 接続:
必要な認証情報と認証の詳細を提供することにより、クラウドデータソースへの安全な再利用可能な接続を構成します。 - 処理:
データ処理の頻度とバッチサイズを構成します。 - クエリ構成:
基本または高度なクエリ構成から選択します。基本はデフォルトスキーマからインポートする列を選択し、SQLの
WHERE句を使用してそのデータを精査します。高度な構成では、複数のテーブルを結合し、データ処理を完全に制御するために高度なSQLコマンドを使用できます。どちらの構成でも、新規または更新された行が検出される方法を制御するクエリモードを使用します。これには、タイムスタンプ列、増分列、またはその両方を使用します。 - 列のマッピング:
クラウドデータベースの列をTealiumイベント属性にマッピングします。これにより、ソースのデータがTealiumの適切な属性に正しく割り当てられます。 - 訪問IDのマッピング:
ソース間のデータを統合するために、データソースの列をAudienceStreamの訪問ID属性にマッピングします。これにより、正確な訪問のスティッチングとプロファイルの充実が可能になります。
インポートされた各行はTealiumのイベントとして処理され、クラウドシステムからの大量データを他のイベントデータとともにリアルタイム処理、セグメンテーション、およびアクティベーションに使用できます。
プロファイルごとに最大10個のクラウドデータウェアハウスデータソースを有効にすることができます。
イベント処理
インポートされた各行は、イベント属性にマッピングされた列としてイベントとして処理されます。イベント属性にマッピングされていない列は無視されます。
デフォルトのTealium データ収集の操作順序では、クラウドデータソースからのイベントはイベント受信ステップの前に処理され、操作の順序は変更されません。
クラウドデータソースの行は、他のデータソースからのイベントと同様にEventStreamおよびAudienceStreamで処理されますが、以下の重要な例外があります:
- ブラウザ固有の属性:
User agentなどのブラウザ固有の属性は構成されません。 - エンリッチメント:AudienceStreamは
First visitの事前読み込み属性のみをエンリッチします。事前読み込み属性の他のエンリッチメントはスキップされます。 - シングルページ訪問:受信イベントはシングルページ訪問の基準から除外されます。他のデータソースからのシングルページ訪問および訪問はAudienceStreamに保持されません。詳細については、AudienceStreamでのシングルページ訪問の処理方法を参照してください。
- 訪問の長さ:クラウドデータソースイベントによって開始された訪問は60秒間続きます。
- 訪問IDのマッピング:クラウドデータソースの構成でAudienceStream訪問ID属性をマッピングする場合、訪問IDは選択した列の値に直接構成され、エンリッチメントは必要ありません。
スケジューリング
処理構成セクションでは、クラウドデータソースが新しいデータをいつ、どのようにインポートするかを制御します。処理を有効または無効にし、データがインポートされる頻度を構成できます。各インポートは、1,000行のバッチでデータを処理します。
頻度
データをインポートする頻度を選択します:
| オプション | 説明 |
|---|---|
| ほぼリアルタイム | 2秒ごとにデータを取得します。低遅延のユースケースに最適です。 |
| 毎時 | 毎時の開始時に実行されます。 |
| 毎日 | 構成した時刻(UTC)で1日に1回実行されます。 |
| 毎週 | 構成した日と時刻(UTC)で1週間に1回実行されます。 |
高頻度でデータを取得する(ほぼリアルタイムまたは毎時)と、データウェアハウスでのコスト増加やシステムへの負荷が発生する可能性があります。
バッチサイズ
クラウドデータソースは、デフォルトで1,000行のバッチでデータをインポートします。この制限は、各バッチのサイズに適用され、インポートで処理される行の総数には適用されません。必要なバッチが何回必要になるかに関わらず、スケジュールされた各インポートは利用可能なすべての行が取り込まれるまで処理を続けます。
以下のバッチオプションから選択してください:
- デフォルト:バッチあたり1,000レコード。
- カスタム:1,000レコードを超えるカスタムバッチを作成します。
- 制限なし:利用可能なすべてのデータを処理するためのバッチを制限なしで作成します。
ユースケースに最適なクエリバッチサイズを最適化することで、以下の利点があります:
- 計算コストの削減:外部データウェアハウスおよびデータベース内の計算費用を削減します。
- データの整合性の向上:繰り返しタイムスタンプによって発生する可能性のある繰り返しレコードの取得を防ぎます。
クラウドプロバイダーは、クエリの数またはクエリのサイズに基づいて課金を計算する場合があります。
この動作は、クエリモードを選択する際に考慮することが重要です。
レート制限
クラウドデータソースからのインポートは、通常、アカウントごとに秒間200イベントに制限されていますが、変動する場合があります。標準の属性サイズ制限も適用されます。詳細については、属性について > サイズ制限を参照してください。
クエリ構成
Tealiumデータソースは、データを処理するための2つの構成をサポートしています:基本と高度。
- 基本モード:データソース構成で指定したデフォルトスキーマを使用してデータをインポートします。1つのテーブルまたはビューからのみデータを処理できます。必要に応じて、SQLの
WHERE句を含めて、カスタム条件に一致するレコードのみをインポートします。 - 高度モード:高度なSQLエディターを使用して、複数のスキーマからのテーブルを1つ以上選択して結合できます。SQLエディターは、
CASTやJOINなどの高度なSQLコマンドをサポートしています。
データタイプ
クラウドデータソースはすべてのデータタイプをサポートしています。一般的に、以下のデータタイプマッピングを使用して、データが正しくインポートされるようにします:
| クラウドデータ | Tealium |
|---|---|
| 数値 | 数値属性 |
| 文字列 | 文字列属性 |
| 論理 | ブール属性 |
| 日付と時刻 | 日付属性 |
| 配列 | 文字列の配列、数値の配列、またはブールの配列 |
| その他 | 文字列属性 |
ベンダー固有のデータタイプについては、以下を参照してください:
クエリモード
クラウドデータソースは、テーブルまたはビューからデータをインポートする方法を制御するための次の3つのクエリモードをサポートしています:
- タイムスタンプ + インクリメント
- タイムスタンプ
- インクリメント
各モードは、タイムスタンプ列、インクリメント列、またはその両方を使用して、インポートする行を決定します。
列の要件
クエリモードが効果的に機能するためには、以下のいずれか一つまたは両方が必要です:
- タイムスタンプ列
行が追加または変更されたときに現在の時間に構成されるタイムスタンプ列。タイムスタンプ列が適切に構成されていない場合、行は読み込まれないか、複数回読み込まれる可能性があります。 - インクリメント列
行が追加されるたびに値が増加する数値列。オートインクリメント列の推奨定義は以下の通りです:この定義により、新しい行が追加されるたびに常に昇順のユニークキーが生成されます。常に昇順のユニークキーがない場合、行は読み込まれないか、複数回読み込まれる可能性があります。COL1 NUMBER AUTOINCREMENT START 1 INCREMENT 1
ベンダー固有の要件については、以下を参照してください:
使用事例の要件に合わせてモードを選択してください。これらのモードの動作例については、クエリモードバッチ処理の挙動を参照してください。
タイムスタンプ + インクリメント(推奨)
このモードは、タイムスタンプ列とインクリメント列の両方を使用して、新規または変更された行をインポートします。
前回のインポートより新しいタイムスタンプを持つ行、または同じタイムスタンプでより高いインクリメント値を持つ行がインポートされます。
このモードは、すべての行が意図した通りにインポートされることを最も確実に保証します。
タイムスタンプ
このモードは、タイムスタンプ列を使用して新規または更新された行をインポートします。
前回のインポートより新しいタイムスタンプを持つ行のみがインポートされます。同じタイムスタンプの行をインポートしようとすると、重複するタイムスタンプの行がインポートされない可能性があります。
テーブルに挿入または更新操作ごとにタイムスタンプ列が構成されている場合、このモードを使用してください。
インクリメント
このモードは、インクリメント列を使用して行をインポートします。
前回インポートされた行よりも大きいインクリメント値を持つ行がインポートされます。前回のインポートからの最大値以下のインクリメント値を持つ行はスキップされます。このモードは、既存の行の変更を検出しません。
テーブルにタイムスタンプ列がない場合、このモードを使用してください。
オートインクリメント列を使用するのではなく、自分でインクリメント列を管理する場合は、値が常に増加することを確認してください。
許可するIPアドレス
クラウドデータアカウントに厳しいアクセス制限がある場合は、クラウドデータベースの許可リストにTealiumのIPアドレスを追加してください。
最終更新日 :: 2026年May月20日