クラウドデータソースについて
この記事では、クラウドデータウェアハウスまたはデータベースからデータをインポートする方法について説明します。
要件
この機能には以下が必要です:
- Tealium EventStream、Tealium AudienceStream、または Tealium CloudStream
サポートされているベンダー
クラウドデータソースの構成は、ほぼすべてのベンダーで同じです。概要については、クラウドデータソースの管理を参照してください。
ベンダー固有の構成の詳細については、以下を参照してください:
動作原理
クラウドデータソースは、クラウドデータウェアハウスまたはデータベースをTealiumに接続し、イベントとしてデータをインポートすることができます。このプロセスにはいくつかの重要なコンポーネントが含まれます:
- 接続:
必要な認証情報と認証の詳細を提供することにより、クラウドデータソースへの安全な再利用可能な接続を構成します。 - 処理:
データ処理の頻度とバッチサイズを構成します。 - クエリ構成:
基本または高度なクエリ構成から選択します。基本では、デフォルトのスキーマからインポートする列を選択し、SQLの
WHERE句を使用してそのデータを精査できます。高度な構成では、複数のテーブルを結合し、データ処理を完全に制御するために高度なSQLコマンドを使用できます。いずれの構成でも、新規または更新された行が検出される方法を制御するクエリモードを使用します。これには、タイムスタンプ列、増分列、またはその両方を使用します。 - 列のマッピング:
クラウドデータベースの列をTealiumイベント属性にマッピングします。これにより、ソースのデータがTealiumの適切な属性に正しく割り当てられます。 - 訪問IDのマッピング:
ソース間のデータを統合するために、データソースの列をAudienceStreamの訪問ID属性にマッピングします。これにより、正確な訪問のスティッチングとプロファイルの充実が可能になります。
インポートされた各行はTealiumのイベントとして処理され、クラウドシステムからの大量データをリアルタイム処理、セグメンテーション、およびアクティベーションに使用する他のイベントデータと共に使用できます。
プロファイルごとに最大10個のクラウドデータウェアハウスデータソースを有効にすることができます。
イベント処理
インポートされた各行は、イベント属性にマッピングされた列としてイベントとして処理されます。イベント属性にマッピングされていない列は無視されます。
デフォルトのTealium データ収集の操作順序では、クラウドデータソースからのイベントはイベント受信ステップの前に処理され、操作の順序は変更されません。
クラウドデータソースの行は、他のデータソースからのイベントと同様にEventStreamおよびAudienceStreamで処理されますが、以下の重要な例外があります:
- ブラウザ固有の属性:
User agentなどのブラウザ固有の属性は構成されません。 - エンリッチメント:AudienceStreamは
First visitの事前ロードされた属性のみをエンリッチします。事前ロードされた属性の他のすべてのエンリッチメントはスキップされます。 - シングルページ訪問:受信イベントはシングルページ訪問の基準から除外されます。他のデータソースからのシングルページ訪問および訪問はAudienceStreamに保持されません。詳細については、AudienceStreamでのシングルページ訪問はどのように処理されますか?を参照してください。
- 訪問の長さ:クラウドデータソースイベントによって開始された訪問は60秒間続きます。
- 訪問IDのマッピング:クラウドデータソースの構成でAudienceStreamの訪問ID属性をマッピングする場合、訪問IDは選択した列の値に直接構成され、エンリッチメントは必要ありません。
スケジューリング
処理構成セクションでは、クラウドデータソースが新しいデータをいつ、どのようにインポートするかを制御します。処理を有効または無効にし、データがインポートされる頻度を構成できます。各インポートは、1,000行のバッチでデータを処理します。
頻度
データをインポートする頻度を選択します:
| オプション | 説明 |
|---|---|
| ほぼリアルタイム | 2秒ごとにデータを取得します。低遅延のユースケースに最適です。 |
| 毎時 | 毎時の開始時に実行されます。 |
| 毎日 | 構成した時刻(UTC)で1日に1回実行されます。 |
| 毎週 | 構成した日と時刻(UTC)で1週間に1回実行されます。 |
高頻度でデータを取得する(ほぼリアルタイムまたは毎時)と、データウェアハウスでのコストとシステムへの負荷が増加する可能性があります。
バッチサイズ
クラウドデータソースは、デフォルトで1,000行のバッチでデータをインポートします。この制限は、各バッチのサイズに適用され、インポートで処理される行の総数には適用されません。各スケジュールされたインポートは、必要なバッチ数に関係なく、利用可能なすべての行が取り込まれるまで処理を続けます。
以下のバッチオプションから選択してください:
- デフォルト:バッチあたり1,000レコード。
- カスタム:1,000レコードを超えるカスタムバッチを作成します。
- 制限なし:利用可能なすべてのデータを処理するためのバッチを作成します。
ユースケースに最適なクエリバッチサイズを最適化することで、以下の利点が得られます:
- 計算コストの削減:外部データウェアハウスおよびデータベース内の計算費用を削減します。
- データの整合性の向上:繰り返しタイムスタンプによって発生する可能性のある繰り返しレコードの取得を防ぎます。
クラウドプロバイダーは、クエリの数またはクエリのサイズに基づいて課金する場合があります。
この動作は、クエリモードを選択する際に考慮することが重要です。
レート制限
クラウドデータソースからのインポートは通常、アカウントごとに秒間200イベントに制限されていますが、変動する場合があります。標準の属性サイズ制限は引き続き適用されます。詳細については、属性について > サイズ制限を参照してください。
クエリ構成
Tealiumデータソースは、データを処理するための2つの構成をサポートしています:基本と高度。
- 基本モード:データソース構成で指定したデフォルトスキーマを使用してデータをインポートします。1つのテーブルまたはビューからのみデータを処理できます。カスタム条件に一致するレコードのみをインポートするために、オプションでSQL
WHERE句を含めることができます。 - 高度モード:高度なSQLエディタを使用して、複数のスキーマからのテーブルを1つ以上選択して結合できます。SQLエディタは、
CASTやJOINなどの高度なSQLコマンドをサポートしています。
データタイプ
クラウドデータソースはすべてのデータタイプをサポートしています。一般的に、以下のデータタイプマッピングを使用して、データが正しくインポートされるようにします:
| クラウドデータ | Tealium |
|---|---|
| 数値 | 数値属性 |
| 文字列 | 文字列属性 |
| 論理 | ブール属性 |
| 日付と時刻 | 日付属性 |
| 配列 | 文字列の配列、数値の配列、またはブールの配列 |
| その他 | 文字列属性 |
ベンダー固有のデータタイプについては、以下を参照してください:
クエリモード
クラウドデータソースは、テーブルまたはビューからデータをインポートする方法を制御するための次の3つのクエリモードをサポートしています:
- タイムスタンプ + 増分
- タイムスタンプ
- 増分
各モードは、タイムスタンプ列、増分列、またはその両方を使用して、インポートする行を決定します。
列の要件
クエリモードが効果的に機能するためには、以下のいずれか一つまたは両方が必要です:
- タイムスタンプ列
行が追加または変更されたときに現在の時間に構成されるタイムスタンプ列。 - インクリメント列
行が追加されるたびに値が増加する数値列。オートインクリメント列の推奨定義は以下の通りです:COL1 NUMBER AUTOINCREMENT START 1 INCREMENT 1
ベンダー固有の要件については、以下を参照してください:
使用事例の要件に合わせてモードを選択してください。これらのモードの動作例については、クエリモードの例を参照してください。
タイムスタンプ + インクリメント(推奨)
このモードは、タイムスタンプ列とインクリメント列の両方を使用して、新規または変更された行をインポートします。
前回のインポートより新しいタイムスタンプを持つ行、または同じタイムスタンプでより高いインクリメント値を持つ行がインポートされます。
このモードは、すべての行が意図した通りにインポートされることを最も確実に保証します。
タイムスタンプ
このモードは、タイムスタンプ列を使用して新規または更新された行をインポートします。
前回のインポートより新しいタイムスタンプを持つ行のみがインポートされます。同じタイムスタンプの行をインポートしようとすると、重複するタイムスタンプの行がインポートされない可能性があります。
テーブルに挿入または更新操作ごとにタイムスタンプ列が構成されている場合、このモードを使用してください。
インクリメント
このモードは、インクリメント列を使用して行をインポートします。
前回のインポート時の最大値よりも大きいインクリメント値を持つ行がインポートされます。前回のインポートからの最大値以下のインクリメント値を持つ行はスキップされます。このモードは、既存の行の変更を検出しません。
テーブルにタイムスタンプ列がない場合、このモードを使用してください。
オートインクリメント列を使用するのではなく、自分でインクリメント列を管理する場合は、値が常に増加することを確認してください。
クエリモードの例
以下の例は、行のバッチ処理とクエリモードがどのように連携するかを示しています。
次の表では、modification_timeがタイムスタンプ列で、customer_idがインクリメント列です。
customer_id |
modification_time |
customer_segment |
|---|---|---|
1 |
01Apr 13:00 |
A |
2 |
01Apr 13:00 |
B |
| … | … | … |
1000 |
01Apr 13:00 |
D |
1001 |
01Apr 13:00 |
E |
1002 |
02Apr 14:00 |
A |
クラウドデータソースは、1,000行ごとにデータを取得し、タイムスタンプ列、インクリメント列、または両方の列で見つかった最高値を記録します。
- タイムスタンプ + インクリメント:
データソースは1-1000行を取得します。次にデータソースがデータを取得する際には、
modification_timeが01Apr 13:00でcustomer_idが1000より大きい行、
または
modification_timeが01Apr 13:00より大きい行を探します。 - インクリメント:
データソースは1-1000行を取得し、1000の最大インクリメント値をマークします。次のインポートでは、最初のインポート以降に変更された場合でも、1-1000行はスキップされます。インクリメント列(例のcustomer_id)を増やす新しい行のみが処理されます。 - タイムスタンプ(例の
modification_time):
データソースは1-1000行を取得し、01Apr 13:00の最大タイムスタンプをマークします。次のインポートでは、01Apr 13:00より大きいタイムスタンプの行がインポートされます。この場合、1001行は同じタイムスタンプ値であるため、前回のデータバッチで取得されたためスキップされます。
列マッピング
列マッピング構成は、クラウドデータベーステーブルの各列に対応するイベント属性を決定します。
列名はTealiumアカウントの属性名と異なることがよくありますので、このマッピングによりデータが適切にインポートされることを保証します。たとえば、テーブルがpostalCodeという列名を使用しているが、Tealiumのイベント属性がcustomer_zipの場合、これらのフィールドを関連付けるマッピングを作成します。
クラウドデータタイプをTealiumデータタイプにマッピングする情報については、データタイプセクションを参照してください。
ベンダー固有のデータタイプについては、以下を参照してください:
訪問IDのマッピング
インポートされたデータがウェブ、モバイル、またはHTTP APIなどの他のソースと繋がるようにするためには、テーブルの各行に一意の訪問IDの列が含まれていることを確認してください。
訪問ID列と対応するイベント属性を訪問ID属性(AudienceStreamでの訪問識別用の一意の属性タイプ)にマッピングします。マッピングされたイベント属性の値はtealium_visitor_id属性に割り当てられ、既存の訪問プロファイルに直接マッチします。
AudienceStreamでの訪問IDマッピングについての詳細は、Tealiumデータソースを使用した訪問識別を参照してください。
許可するIPアドレス
クラウドデータアカウントにリクエストを受け入れるシステムに関して厳格なルールがある場合、Tealium IPアドレスをクラウドデータベースの許可リストに追加してください。
最終更新日 :: 2026年April月16日