クラウドデータソースについて
この記事では、クラウドデータウェアハウスまたはデータベースからデータをインポートする方法について説明します。
要件
この機能には以下が必要です:
- Tealium EventStream または Tealium AudienceStream
サポートされているベンダー
クラウドデータソースの構成は、ほとんどのベンダーでほぼ同じです。概要については、クラウドデータソースの管理を参照してください。
ベンダー固有の構成の詳細については、以下を参照してください:
動作方法
クラウドデータソースは、クラウドデータウェアハウスまたはデータベースをTealiumに接続し、EventStreamまたはAudienceStreamで処理するためのイベントとしてデータをインポートすることを可能にします。このプロセスにはいくつかの重要なコンポーネントが含まれます:
- 接続:
必要な認証情報と認証の詳細を提供することにより、クラウドデータソースへの安全な再利用可能な接続を構成します。接続したら、データをインポートしたい特定のテーブルまたはビューを選択します。 - データソースの構成:
テーブルまたはビューからインポートする列を選択します。新規または更新された行が検出される方法を制御するクエリモードを選択します。タイムスタンプ列、インクリメント列、またはその両方を使用します。さらに、行をフィルタリングするためにSQLWHERE
句を追加して、インポートされるデータを洗練させることができます。 - 列のマッピング:
クラウドデータベースの列をTealiumイベント属性にマッピングします。これにより、ソースからのデータがTealium内の適切な属性に正しく割り当てられることが保証されます。 - 訪問IDのマッピング:
ソース間のデータを統合するために、データソースの列をAudienceStreamの訪問ID属性にマッピングします。これにより、正確な訪問のスティッチングとプロファイルの充実が可能になります。
インポートされた各行はTealiumのイベントとして処理され、クラウドシステムからの大量データをリアルタイム処理、セグメンテーション、およびアクティベーションのために他のイベントデータと共に使用することができます。
プロファイルごとに最大10のクラウドデータウェアハウスデータソースを有効にすることができます。
イベント処理
インポートされた各行は、イベント属性にマッピングされた列としてイベントとして処理されます。イベント属性にマッピングされていない列は無視されます。
デフォルトのTealium データ収集の操作順序では、クラウドデータソースからのイベントはイベント受信ステップの前に処理され、操作の順序は変更されません。
クラウドデータソースの行は、他のデータソースからのイベントと同様にEventStreamおよびAudienceStreamで処理されますが、以下の重要な例外があります:
- ブラウザ固有の属性:
User agent
などのブラウザ固有の属性は構成されません。 - エンリッチメント:AudienceStreamは
First visit
の事前ロードされた属性のみをエンリッチします。事前ロードされた属性の他のすべてのエンリッチメントはスキップされます。 - 関数:データ変換関数は実行されません。
- シングルページ訪問:受信イベントはシングルページ訪問の基準から除外されます。他のデータソースからのシングルページ訪問および訪問はAudienceStreamに保持されません。詳細については、AudienceStreamでシングルページ訪問はどのように処理されますか?を参照してください。
- 訪問の長さ:クラウドデータソースイベントによって開始された訪問は60秒間続きます。
- 訪問IDのマッピング:クラウドデータソース構成でAudienceStream訪問ID属性をマッピングする場合、訪問IDはエンリッチメントなしで選択した列の値に直接構成されます。
レート制限
クラウドデータソースからのインポートは通常、アカウントごとに秒間500イベントに制限されていますが、変動する場合があります。標準の属性サイズ制限は引き続き適用されます。詳細については、属性について>サイズ制限を参照してください。
バッチサイズ
クラウドデータソースはデータをバッチでインポートし、バッチあたりの最大行数は1,000行です。クエリモードを選択する際には、この動作を考慮することが重要です。
テーブル
各クラウドデータソースは、一つのテーブルまたはビューからデータをインポートすることをサポートしています。複数のテーブルからデータをインポートするには、クラウドデータベースでビューを作成し、データソース構成でそのビューを選択します。
データタイプ
クラウドデータソースはすべてのデータタイプをサポートしています。一般的に、以下のデータタイプマッピングを使用して、データが正しくインポートされることを確認してください:
クラウドデータ | Tealium |
---|---|
数値 | 数値属性 |
文字列 | 文字列属性 |
論理 | ブール属性 |
日付と時間 | 日付属性 |
配列 | 文字列の配列、数値の配列、またはブールの配列 |
その他 | 文字列属性 |
ベンダー固有のデータタイプについては、以下を参照してください:
クエリモード
クラウドデータソースは、テーブルまたはビューからデータをインポートする方法を制御するための次の3つのクエリモードをサポートしています:
- タイムスタンプ + インクリメント
- タイムスタンプ
- インクリメント
各モードは、タイムスタンプ列、インクリメント列、またはその両方を使用して、インポートする行を決定します。
列の要件
クエリモードが効果的に機能するためには、以下のいずれかまたは両方が必要です:
- タイムスタンプ列
行が追加または変更されたときに現在の時間に構成されるタイムスタンプ列。 - インクリメント列
行が追加されるたびに値が増加する数値列。自動インクリメント列の推奨定義は次のとおりです:COL1 NUMBER AUTOINCREMENT START 1 INCREMENT 1
ベンダー固有の要件については、以下を参照してください:
使用事例の要件に合わせてモードを選択します。これらのモードの動作例については、クエリモードの例を参照してください。
タイムスタンプ + インクリメント(推奨)
このモードは、タイムスタンプ列とインクリメント列の両方を使用して、新規または変更された行をインポートします。
前回のインポートより新しいタイムスタンプを持つ行、または前回インポートされた行より大きいインクリメント値を持つ行、またはその両方がある場合に行がインポートされます。
このモードは、すべての行が意図した通りにインポートされることを最も確実に保証します。
タイムスタンプ
このモードは、タイムスタンプ列を使用して新規または更新された行をインポートします。
前回のインポートより新しいタイムスタンプを持つ行がインポートされます。
挿入または更新操作ごとにタイムスタンプ列が構成されているテーブルを使用する場合は、このモードを使用します。
同じタイムスタンプを持つ行の数がバッチサイズを超える場合、一部の行はインポートされないことに注意してください。
インクリメント
このモードは、インクリメント列を使用して行をインポートします。
前回のインポートより大きいインクリメント値を持つ行がインポートされます。前回のインポートからの最大値以下のインクリメント値を持つ行はスキップされます。このモードは、既存の行の変更を検出しません。
テーブルにタイムスタンプ列がない場合は、このモードを使用します。
自動インクリメント列を使用せずに独自のインクリメント列を維持する場合は、値が常に増加することを確認してください。
クエリモードの例
以下の例は、行のバッチ処理とクエリモードがどのように連携して動作するかを示しています。
次の表では、modification_time
がタイムスタンプ列であり、customer_id
が増加列です。
customer_id |
modification_time |
customer_segment |
---|---|---|
1 |
01Apr 13:00 |
A |
2 |
01Apr 13:00 |
B |
… | … | … |
1000 |
01Apr 13:00 |
D |
1001 |
01Apr 13:00 |
E |
1002 |
02Apr 14:00 |
A |
クラウドデータソースは、1,000行ごとにデータを取得し、タイムスタンプ列、増加列、または選択されたクエリモードに応じて両方の列で見つかった最高値を記録します。
- タイムスタンプ + 増加:
データソースは行1-1000を取得します。次にデータソースがデータを取得する際には、
modification_time
が01Apr 13:00
でcustomer_id
が1000
より大きい行、
または
modification_time
が01Apr 13:00
より大きい行を探します。 - 増加:
データソースは行1-1000を取得し、増加値の最大値1000
をマークします。次のインポートでは、最初のインポート以降に変更された場合でも、行1-1000はスキップされます。例のcustomer_id
が増加する新しい行のみが処理されます。 - タイムスタンプ(例の
modification_time
):
データソースは行1-1000を取得し、最大タイムスタンプ01Apr 13:00
をマークします。次のインポートでは、01Apr 13:00
より大きいタイムスタンプの行がインポートされます。この場合、行1001
は同じタイムスタンプ値であるため、前回のデータバッチで取得されたためスキップされます。
SQLクエリ
クラウドデータソースの クエリ構成 で、インポートしたい列を選択します。クエリモードを超えてインポートの条件を追加するには、SQLの WHERE
句を使用します。このオプションはクエリに WHERE
文を追加します。WHERE
文は有効なSQL構文を使用する必要があります。
WHERE
句は複数のテーブルからのサブクエリをサポートしていません。複数のテーブルからデータをインポートするには、クラウドデータベースにビューを作成し、データソース構成でそのビューを選択します。
スケジューリング
処理構成 セクションは、クラウドデータソースが新しいデータをいつ、どのようにインポートするかを制御します。処理を有効または無効に構成し、データがインポートされる頻度を構成できます。各インポートは1,000行のデータをバッチ処理します。
頻度
データをインポートする頻度を選択します:
オプション | 説明 |
---|---|
ほぼリアルタイム | 2秒ごとにデータを取得します。低遅延のユースケースに最適です。 |
毎時 | 毎時の開始時に実行されます。 |
毎日 | 構成した時間(UTC)に1日1回実行されます。 |
毎週 | 構成した日と時間(UTC)に1週間に1回実行されます。 |
高頻度でデータを取得する(ほぼリアルタイムまたは毎時)と、データウェアハウスのコスト増加やシステムへの負荷が増加する可能性があります。
列マッピング
列マッピング構成は、クラウドデータベーステーブルの各列に対応するイベント属性を決定します。
列名はしばしばTealiumアカウントの属性名と異なるため、このマッピングはデータが適切にインポートされることを確実にします。たとえば、テーブルが postalCode
という列名を使用している場合でも、Tealiumのイベント属性が customer_zip
であれば、これらのフィールドを関連付けるマッピングを作成します。
クラウドデータタイプをTealiumデータタイプにマッピングする情報については、データタイプ セクションを参照してください。
ベンダー固有のデータタイプについては、以下を参照してください:
訪問IDマッピング
インポートされたデータがウェブ、モバイル、HTTP APIなど他のソースと繋がるようにするためには、テーブルの各行に一意の訪問IDの列が含まれていることを確認します。
訪問ID列と対応するイベント属性をAudienceStreamの訪問識別用の一意の属性タイプである訪問ID属性にマッピングします。マッピングされたイベント属性の値は tealium_visitor_id
属性に割り当てられ、既存の訪問プロファイルに直接マッチします。
AudienceStreamでの訪問IDマッピングについての詳細は、Tealiumデータソースを使用した訪問識別を参照してください。
許可するIPアドレス
クラウドデータアカウントに厳格なシステムリクエスト受け入れルールがある場合は、Tealium IPアドレスをクラウドデータベースの許可リストに追加してください。
最終更新日 :: 2025年June月17日