CloudStreamデータソースの管理
この記事では、CloudStreamデータソースの管理方法について説明します。
サポートされているベンダー
クラウドデータソースの構成は、ほとんどのベンダーでほぼ同じです。ベンダー固有の構成の詳細については、以下を参照してください:
クラウドデータソースの作成
CloudStream用のクラウドデータソースを作成するには、以下の手順を使用します:
- CloudStream > Data Sourcesに移動します。
- + Add Data Sourceをクリックします。
- Categoriesの下でData Warehouseをクリックし、ベンダーを選択します。
- Nameフィールドに、使用事例に関連するデータソースの一意の名前を入力します。
- Continueをクリックします。
プロファイルで最大10個のデータソースに接続できます。
接続の確立
データのインポートを構成する前に、クラウドデータソースへの接続を確立する必要があります。接続は、Tealiumをクラウドデータソースに接続するベンダーの資格情報の再利用可能な構成です。
Connection Configuration画面で、データソースの名前を確認し、リストから既存の接続を選択するか、**+**アイコンをクリックして接続を作成します。
SaveをクリックしてConnection Configuration画面に戻り、Establish Connectionをクリックします。
接続を正常に確立した後、Table Selectionリストからテーブルを選択します。
ベンダーへの接続に関する詳細は、以下を参照してください:
処理の有効化
Enable Processingをオンにして、変更を保存して公開した直後にデータのインポートを開始します。または、構成を完了するまでこの構成をオフにしておき、後でオンにします。
データソース、セグメント、またはアクティベーションを有効にする前に、データソースとクエリをテストすることをお勧めします。
頻度
データを取得する頻度を選択します:
- ほぼリアルタイム:プロセスは2秒ごとに実行されます。
- 毎時:プロセスは毎時開始時に実行されます。
- 毎日:プロセスは選択した時間(UTC)に1日1回実行されます。
- 毎週:プロセスは指定した日と時間(UTC)に1週間に1回実行されます。
クエリモードとクエリの構成
Query Mode and Configuration画面で、適切なクエリモードを選択し、カスタム条件に一致するレコードのみをインポートするために、必要に応じてSQL WHERE句を含めます。
クエリモードの選択
クエリモードは、新しい行、変更された行、またはその両方をインポートする方法を決定します。タイムスタンプとインクリメント列は、中断やエラー後にコネクタが正しい位置から再開できるようにすることで、データの欠落や重複を防ぎます。
- **タイムスタンプ + インクリメント(推奨)**を選択する場合、タイムスタンプ列と厳密にインクリメントする列の2つの列を選択する必要があります。
- タイムスタンプまたはインクリメントを選択する場合、新しい行と変更された行、または新しい行のみを検出するために使用する列を選択する必要があります。
- フルリシンクを選択すると、各インポートサイクル中にすべての行がインポートされます。このオプションは、データが頻繁に変更される場合や、すべてのレコードが最新であることを確認したい場合に便利です。フルリシンククエリモードでは、毎時または毎日の頻度を使用し、タイムスタンプ列、インクリメント列、またはその両方を指定する必要があります。
フルリシンクモードではオフセット管理は利用できません。
詳細については、クラウドデータソースについてを参照してください。
クエリの構成
クエリを構成するには、以下の手順を使用します:
-
Query > Select Columnsセクションで、インポートする列を選択します。テーブルまたはビューを変更するには、Previousをクリックして別のテーブルを選択します。
-
(オプション) カスタム条件を追加するには、SQL
WHERE句を含めます。WHERE句は複数のテーブルからのサブクエリをサポートしていません。複数のテーブルからデータをインポートするには、ビューを作成し、データソース構成でそのビューを選択します。 -
フルリシンククエリモードの場合、インポートするレコードの最大数をLimitで入力します。毎日のクエリでは最大1,000,000レコード、毎時のクエリでは最大50,000レコードをインポートできます。
-
Test QueryをクリックしてSQLクエリを検証し、結果をプレビューします。
列のマッピング
列マッピングページでは、前のステップで選択した列が表示されます。各列には自動的にデータタイプが割り当てられ、必要に応じて変更できる推奨されるクラウド属性名が提案されます。
クラウド属性にマッピングされていない列は無視されます。
概要
この最終ステップでは、概要を表示し、必要に応じて修正を加えてからプロファイルを保存して公開します。構成を編集するには、変更を加えたいステップに戻るためにPreviousをクリックします。
- クラウド属性のマッピングを確認します。
- Finishをクリックしてデータソースを作成し、構成画面を終了します。新しいデータソースはData Sourcesダッシュボードにリストされます。
- Save/Publishをクリックして変更を保存して公開します。
テスト構成
データソース、セグメント、またはアクティベーションを有効にする前に、データソースとクエリのテストを行うことをお勧めします。ただし、テストを実行すると、セグメントがアクティブになる可能性があり、有効なアクションがトリガーされるか、下流システムに影響を与える可能性があります。意図しない結果を防ぐために、コネクターと機能を無効にし、テストレコードを制限し、受信者と調整してください。
データソース構成をテストするには、以下の手順を使用します:
- データソースウィンドウの右上隅にあるアクションボタンをクリックし、エンドツーエンドテストをクリックします。
- 出力を受け取りたい方法を選択します。
- 新しいトレースセッション:出力は最大10レコードの新しいトレースセッションで表示されます。このオプションは、エンドツーエンドの検証とログの詳細を確認するのに最適です。
- 既存のトレースセッション:すでに開始したトレースセッションで出力が表示されます。トレースIDを入力し、トレースに参加をクリックします。
- ダイレクト出力:出力の生の結果が画面に表示されます。データレコードにトレースIDは追加されず、トレースは利用できません。このオプションは、クエリと属性マッピングを迅速に確認するのに最適です。
- テストのために処理する行数を選択します。最大行数は10です。
- テストクエリの下で、テストに含めるテーブルの列を選択します。リストから列を削除するには、列のXをクリックします。少なくとも1つの列を選択する必要があります。
- From Tableの下で、クエリを実行するテーブルを選択します。選択列ボックスがテーブルの列で更新されます。
- Whereの下で、テーブルに対して実行するSQLクエリを入力します。
- クエリチェックをクリックしてSQLを検証し、必要なフィールドが構成されていることを確認します。
- 結果はクエリ結果プレビュータブの下のテーブルに表示されます:
- テスト開始をクリックして構成テストを開始します。
右サイドバーには、テストの完了までの時間を見積もるプログレスバーと、テストがエラーに遭遇した場合に知らせるステータスメッセージが表示されます。
テストが完了すると、結果が表示されます:
- トレースでテストの実行を見たい場合は、トレースに参加をクリックします。
- テストが失敗した場合、次のことができます:
- テスト構成の編集をクリックして構成を変更します。
- テストを再試行をクリックして現在の構成を再度実行します。
データソースの複製
データソースを複製するには:
- データソースをクリックします。
- 複製ボタンをクリックします。
- 複製されたデータソースに名前を入力します。
データソースの編集
データソースを編集するには、以下の手順を使用します:
- データソースをクリックします。
- 編集ボタンをクリックします。
- 必要に応じて構成を更新します。
- 完了をクリックします。
オフセットの管理
データソースは、クエリが開始されるクラウドデータビューまたはテーブルの日付またはインクリメント値の位置を追跡します。オフセットを使用すると、クエリを開始するビューまたはテーブルの位置をリセットまたは手動で構成して制御できます。
たとえば、最近のメーリングリストのアクティベーションにエラーが含まれており、100レコードが処理された場合、現在のインクリメントオフセットは342です。メールアクティベーションを修正した後、これらのレコードを再処理するには、オフセットを242に構成します。データソースを再起動すると、その位置からレコードのクエリが開始され、修正されたメールが送信されます。
次の条件が真の場合にのみ、オフセットを管理できます:
- 現在のプロファイルが公開されています。
- クエリモードはタイムスタンプ + インクリメント(推奨)、タイムスタンプ、またはインクリメントです。フルリシンククエリモードでは、オフセットを管理できません。
- データソースが停止しています。
- データソースのステータスが実行中、スケジュールされている、または失敗している場合、オフセットを編集することはできません。現在のオフセットに関する情報のみが利用可能です。
- ステータスが初期化中、非アクティブ、または接続エラーがある場合、オフセットは利用できません。
データソースのオフセットを管理するには、以下の手順を使用します:
- データソースの詳細ウィンドウの右上隅にあるアクションボタンをクリックし、オフセットの管理をクリックします。
- 利用可能なオフセット方法はタイムスタンプとインクリメント列です。クエリモードが利用可能なオフセットを決定します。
- タイムスタンプ列の下で、タイムスタンプを表すテーブルの列を選択します。
- 新しいタイムスタンプの下で、データをインポートする際にタイムスタンプからオフセットする日時を選択します。
- 新しいタイムスタンプは過去の日時でなければなりません。未来の日時は使用できません。
- 現在のタイムスタンプフィールドには、現在使用されているオフセットが表示されます。
- インクリメント列の下で、テーブルに追加される各行のインクリメント値を表す列を選択します。
- 新しいインクリメントの下で、データをインポートする際にIDからオフセットする数を入力します。
- 新しいオフセットIDは正の整数でなければなりません。
- 現在のオフセットIDフィールドには、オフセットとして使用する現在の数が表示されます。
オフセット変更の検証をクリックして、新しいオフセット位置からインポートされるデータのプレビューを表示します。テーブルにはサンプル行が表示され、オフセットを調整した後に処理される行数の見積もりも提供されます。
完了をクリックして新しいオフセット構成を確認します。キャンセルをクリックして変更を破棄します。
オフセットを変更した後、データソースを再起動します。
処理された行とエラー
インポート活動を確認するには、データソースに移動し、データソースを展開します。
CloudStreamは、1秒あたり最大500データレコードをインポートできます。
ステータス
クラウドデータソースを構成した後、次のようなステータスが表示される場合があります:
| ステータス | 説明 |
|---|---|
| 失敗 | 接続エラーが発生しました。たとえば、認証失敗などで、エラーが解決されるまでインポートは停止されます。インポート中の行レベルのエラーはこのステータスをトリガーせず、データソースは実行中のままでエラーが記録されます。 |
| 非アクティブ | データソースは作成されましたが、オンにされたことがなく、他のステータスに移行することもありませんでした。 |
| 初期化中 | コネクタが初めて起動するか、停止状態から再開するときです。これは一時的な状態で、実行中またはスケジュール済みに移行する前の状態です。 |
| 実行中 | コネクタはアクティブにクエリを実行し、データをインポートしています。 |
| スケジュール済み | 次のインポートがスケジュールされています。この状態は初期化中または実行中の後に続くことがあります。 |
| 停止 | データソースは以前に有効にされましたが、現在はオフになっています。有効にされるまでデータのインポートは行われません。 |
| 未割り当て | タスクはクラウドワーカーに割り当てられるのを待っています。 |
最終更新日 :: 2025年October月22日