クラウドデータソースについて
この記事では、クラウドデータウェアハウスまたはデータベースからデータをインポートする方法について説明します。
要件
この機能には以下が必要です:
- Tealium EventStream、Tealium AudienceStream、または Tealium CloudStream
サポートされるベンダー
クラウドデータソースの構成は、ほぼすべてのベンダーで同じです。概要については、クラウドデータソースの管理を参照してください。
ベンダー固有の構成の詳細については、以下を参照してください:
仕組み
クラウドデータソースは、クラウドデータウェアハウスまたはデータベースをTealiumに接続し、イベントとしてデータをインポートすることができます。プロセスにはいくつかの重要なコンポーネントが含まれます:
- 接続:
必要な認証情報と認証の詳細を提供することで、クラウドデータソースへの安全な再利用可能な接続を構成します。接続したら、データをインポートする特定のテーブルまたはビューを選択します。 - データソースの構成:
テーブルまたはビューからインポートする列を選択します。新規または更新された行を検出する方法を制御するクエリモードを選択します—タイムスタンプ列、インクリメント列、またはその両方を使用します。SQLWHERE句を追加して行をフィルタリングすることで、インポートされるデータをさらに絞り込むことができます。 - 列のマッピング:
クラウドデータベースの列をTealiumイベント属性にマッピングします。これにより、ソースからのデータがTealium内の適切な属性に正しく割り当てられることを保証します。 - 訪問IDのマッピング:
ソース間のデータを統合するために、データソースの列をAudienceStreamの訪問ID属性にマッピングします。これにより、正確な訪問のスティッチングとプロファイルの充実が可能になります。
インポートされた各行はTealiumのイベントとして処理され、クラウドシステムからの大量データをリアルタイム処理、セグメンテーション、およびアクティベーションのために他のイベントデータと共に使用することができます。
プロファイルごとに最大10個のクラウドデータウェアハウスデータソースを有効にすることができます。
イベント処理
インポートされた各行は、イベント属性にマッピングされた列としてイベントとして処理されます。イベント属性にマッピングされていない列は無視されます。
デフォルトのTealium データ収集の操作順序では、クラウドデータソースからのイベントはイベント受信ステップの前に処理され、操作の順序は変更されません。
クラウドデータソースの行は、他のデータソースからのイベントと同様にEventStreamおよびAudienceStreamで処理されますが、以下の重要な例外があります:
- ブラウザ固有の属性:
User agentなどのブラウザ固有の属性は構成されません。 - エンリッチメント:AudienceStreamは
First visitの事前ロードされた属性のみをエンリッチします。事前ロードされた属性の他のすべてのエンリッチメントはスキップされます。 - 関数:データ変換関数は実行されません。
- シングルページ訪問:受信イベントはシングルページ訪問の基準から除外されます。他のデータソースからのシングルページ訪問および訪問はAudienceStreamに保持されません。詳細については、AudienceStreamでのシングルページ訪問はどのように処理されますか?を参照してください。
- 訪問の長さ:クラウドデータソースイベントによって開始された訪問は60秒間続きます。
- 訪問IDのマッピング:クラウドデータソース構成でAudienceStream訪問ID属性をマッピングする場合、訪問IDは選択した列の値に直接構成され、エンリッチメントは必要ありません。
スケジューリング
処理構成セクションは、クラウドデータソースが新しいデータをいつ、どのようにインポートするかを制御します。処理を有効または無効にし、データがインポートされる頻度を構成できます。各インポートは、1,000行のバッチでデータを処理します。
頻度
データをインポートする頻度を選択します:
| オプション | 説明 |
|---|---|
| ほぼリアルタイム | 2秒ごとにデータを取得します。低遅延のユースケースに最適です。 |
| 毎時 | 毎時の開始時に実行されます。 |
| 毎日 | 構成した時刻(UTC)に1日1回実行されます。 |
| 毎週 | 構成した日と時刻(UTC)に1週間に1回実行されます。 |
高頻度でデータを取得する(ほぼリアルタイムまたは毎時)と、データウェアハウスでのコスト増加やシステムへの負荷が発生する可能性があります。
バッチサイズ
クラウドデータソースは、デフォルトで1,000行のバッチでデータをインポートします。この制限は、各バッチのサイズに適用され、インポートで処理される行の総数には適用されません。各スケジュールされたインポートは、必要なバッチ数に関係なく、利用可能なすべての行が取り込まれるまで処理を続けます。
以下のバッチオプションから選択してください:
- デフォルト:バッチあたり1,000レコード。
- カスタム:1,000レコードを超えるカスタムバッチを作成します。
- 制限なし:利用可能なすべてのデータを処理するためのバッチを制限なしで作成します。
ユースケースに最適なクエリバッチサイズを最適化することで、以下の利点があります:
- 計算コストの削減:外部データウェアハウスおよびデータベース内の計算費用を削減します。
- データの整合性の向上:繰り返されるタイムスタンプによって発生する可能性のある繰り返しレコードの取得を防ぎます。
クラウドプロバイダーは、クエリの数またはクエリのサイズに基づいて課金を計算する場合があります。
この動作は、クエリモードを選択する際に考慮することが重要です。
レート制限
クラウドデータソースからのインポートは、通常、アカウントごとに秒間200イベントに制限されていますが、変動する場合があります。標準の属性サイズ制限は引き続き適用されます。詳細については、属性について > サイズ制限を参照してください。
テーブル
各クラウドデータソースは、1つのテーブルまたはビューからデータをインポートすることをサポートしています。複数のテーブルからデータをインポートするには、クラウドデータベースでビューを作成し、データソース構成でそのビューを選択します。
データタイプ
クラウドデータソースはすべてのデータタイプをサポートしています。一般的に、以下のデータタイプマッピングを使用して、データが正しくインポートされることを確認します:
| クラウドデータ | Tealium |
|---|---|
| 数値 | 数値属性 |
| 文字列 | 文字列属性 |
| 論理 | ブール属性 |
| 日付と時刻 | 日付属性 |
| 配列 | 文字列の配列、数値の配列、またはブールの配列 |
| その他 | 文字列属性 |
ベンダー固有のデータタイプについては、以下を参照してください:
クエリモード
クラウドデータソースは、テーブルまたはビューからデータをインポートする方法を制御するために、以下の3つのクエリモードをサポートしています:
- タイムスタンプ + インクリメント
- タイムスタンプ
- インクリメント
各モードは、タイムスタンプ列、インクリメント列、またはその両方を使用して、インポートする行を決定します。
列の要件
クエリモードが効果的に機能するためには、以下のいずれか一つまたは両方が必要です:
- タイムスタンプ列
行が追加または変更されたときに現在の時間に構成されるタイムスタンプ列。 - インクリメント列
行が追加されるたびに値が増加する数値列。オートインクリメント列の推奨定義は以下の通りです:COL1 NUMBER AUTOINCREMENT START 1 INCREMENT 1
ベンダー固有の要件については、以下を参照してください:
使用例については、クエリモードの例を参照してください。
タイムスタンプ + インクリメント(推奨)
このモードは、タイムスタンプ列とインクリメント列の両方を使用して、新規または変更された行をインポートします。
前回のインポートより新しいタイムスタンプを持つ行、または同じタイムスタンプでより高いインクリメント値を持つ行がインポートされます。
このモードは、意図した通りにすべての行がインポートされることを最も確実に保証します。
タイムスタンプ
このモードは、タイムスタンプ列を使用して新規または更新された行をインポートします。
前回のインポートより新しいタイムスタンプを持つ行がインポートされます。
テーブルに挿入または更新操作ごとにタイムスタンプ列が構成されている場合、このモードを使用してください。
同じタイムスタンプを持つ行の数がバッチサイズを超える場合、一部の行がインポートされないことに注意してください。
インクリメント
このモードは、インクリメント列を使用して行をインポートします。
前回のインポート時の最大値よりも大きいインクリメント値を持つ行がインポートされます。前回のインポートからの最大値以下のインクリメント値を持つ行はスキップされます。このモードは、既存の行の変更を検出しません。
テーブルにタイムスタンプ列がない場合、このモードを使用してください。
オートインクリメント列を使用するのではなく、自分でインクリメント列を管理する場合は、値が常に増加するようにしてください。
クエリモードの例
次の例は、行のバッチ処理とクエリモードがどのように連携して機能するかを示しています。
次の表では、modification_timeがタイムスタンプ列で、customer_idがインクリメント列です。
customer_id |
modification_time |
customer_segment |
|---|---|---|
1 |
01Apr 13:00 |
A |
2 |
01Apr 13:00 |
B |
| … | … | … |
1000 |
01Apr 13:00 |
D |
1001 |
01Apr 13:00 |
E |
1002 |
02Apr 14:00 |
A |
クラウドデータソースは、1,000行ずつデータを取得し、選択されたクエリモードに応じてタイムスタンプ列、インクリメント列、または両方の列で見つかった最高値を記録します。
- タイムスタンプ + インクリメント:
データソースは1-1000行を取得します。次にデータソースがデータを取得するとき、modification_timeが01Apr 13:00でcustomer_idが1000より大きい行、またはmodification_timeが01Apr 13:00より大きい行を探します。 - インクリメント:
データソースは1-1000行を取得し、1000の最大インクリメント値をマークします。次のインポートでは、最初のインポート以降に変更された場合でも、1-1000行はスキップされます。インクリメント列(例のcustomer_id)を増やす新しい行のみが処理されます。 - タイムスタンプ(例の
modification_time):
データソースは1-1000行を取得し、01Apr 13:00の最大タイムスタンプをマークします。次のインポートでは、01Apr 13:00より大きいタイムスタンプを持つ行がインポートされます。この場合、1001行は同じタイムスタンプ値を持っているため、前回のデータバッチで取得されたためスキップされます。
最終更新日 :: 2026年February月27日