翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS Clean Rooms ML
AWS Clean Rooms ML を使用すると、2 人以上の関係者がデータで機械学習モデルを実行でき、相互にデータを共有する必要はありません。このサービスは、データ所有者がデータとモデル IP を保護できるようにするプライバシー強化コントロールを提供します。 AWS オーサリングされたモデルを使用することも、独自のカスタムモデルを使用することもできます。
この動作の詳細な説明については、「クロスアカウントジョブ」を参照してください。
Clean Rooms ML モデルの機能の詳細については、以下のトピックを参照してください。
トピック
ML AWS Clean Rooms が AWS モデルと連携する方法
類似モデルを使用するには、トレーニングデータプロバイダーとシードデータプロバイダーの 2 つの関係者が で順次作業 AWS Clean Rooms して、データをコラボレーションに取り込む必要があります。トレーニングデータプロバイダーが最初に完了しなければならないワークフローは次のとおりです。
-
トレーニングデータプロバイダーのデータは、ユーザーとアイテムのインタラクション AWS Glue のデータカタログテーブルに保存する必要があります。少なくとも、トレーニングデータにはユーザー ID 列、インタラクション ID 列、およびタイムスタンプ列が含まれている必要があります。
-
トレーニングデータプロバイダーは、トレーニングデータを に登録します AWS Clean Rooms。
-
トレーニングデータプロバイダーは、複数のシードデータプロバイダーと共有できる類似モデルを作成します。類似モデルはディープニューラルネットワークであり、トレーニングに最大 24 時間かかることがあります。このモデルは自動的に再トレーニングされないため、毎週再トレーニングすることをお勧めします。
-
トレーニングデータプロバイダーは、関連メトリクスを共有するかどうかや、出力セグメントの Amazon S3 ロケーションなど、類似モデルの設定を行います。トレーニングデータプロバイダーは、1 つの類似モデルから複数の設定済み類似モデルを作成できます。
-
トレーニングデータプロバイダーは、設定したオーディエンスモデルをシードデータプロバイダーと共有されているコラボレーションに関連付けます。
シードデータプロバイダーが次に完了しなければならないワークフローは次のとおりです。
-
シードデータプロバイダーのデータは Amazon S3 バケットに保存することも、クエリの結果から取得することもできます。
-
シードデータプロバイダーは、トレーニングデータプロバイダーと共有するコラボレーションを開きます。
-
シードデータプロバイダーは、コラボレーションページの [Clean Rooms ML] タブから類似セグメントを作成します。
-
シードデータプロバイダーは、関連性メトリクスが共有されていれば、それを評価し、 AWS Clean Roomsの外部で使用するために類似セグメントをエクスポートできます。
ML AWS Clean Rooms がカスタムモデルと連携する方法
Clean Rooms ML を使用すると、コラボレーションのメンバーは Amazon に保存されているドッカー化されたカスタムモデルアルゴリズムを使用してECR、データを共同で分析できます。これを行うには、モデルプロバイダーがイメージを作成し、Amazon に保存する必要がありますECR。Amazon Elastic Container Registry ユーザーガイドの手順に従って、カスタム ML モデルを含むプライベートリポジトリを作成します。
コラボレーションのメンバーは、適切なアクセス許可があれば、モデルプロバイダーになることができます。コラボレーションのすべてのメンバーは、トレーニングデータ、推論データ、またはその両方をモデルに提供できます。このガイドでは、データを提供するメンバーをデータプロバイダーと呼びます。コラボレーションを作成するメンバーはコラボレーション作成者であり、このメンバーはモデルプロバイダー、データプロバイダーの 1 つ、またはその両方です。
最も高いレベルでは、カスタム ML モデリングを実行するために完了する必要があるステップは次のとおりです。
-
コラボレーションクリエーターはコラボレーションを作成し、各メンバーに適切なメンバー機能と支払い設定を割り当てます。コラボレーションクリエーターは、コラボレーションの作成後に更新できないため、モデル出力を受け取るか、このステップの適切なメンバーに推論結果を受け取るメンバー機能を割り当てなければなりません。詳細については、「コラボレーションの作成」を参照してください。
-
モデルプロバイダーは、コンテナ化された ML モデルを設定してコラボレーションに関連付け、エクスポートされたデータにプライバシー制約が設定されていることを確認します。詳細については、「モデルアルゴリズムの設定」を参照してください。
-
データプロバイダーは、コラボレーションにデータを提供し、プライバシーのニーズが指定されていることを確認します。データプロバイダーは、モデルがデータにアクセスすることを許可する必要があります。詳細については、トレーニングデータの寄稿および設定済みモデルアルゴリズムの関連付けを参照してください。
-
コラボレーションメンバーは、モデルアーティファクトまたは推論結果のエクスポート先を定義する ML 設定を作成します。
-
コラボレーションメンバーは、トレーニングコンテナまたは推論コンテナに入力を提供する ML 入力チャネルを作成します。ML 入力チャネルは、モデルアルゴリズムのコンテキストで使用されるデータを定義するクエリです。
-
コラボレーションメンバーは、ML 入力チャネルと設定されたモデルアルゴリズムを使用してモデルトレーニングを呼び出します。詳細については、「トレーニング済みモデルの作成」を参照してください。
-
(オプション) モデルトレーナーがモデルエクスポートジョブを呼び出し、モデルアーティファクトがモデル結果レシーバーに送信されます。モデルアーティファクトを受け取ることができるのは、有効な ML 設定を持ち、モデル出力を受け取ることができるメンバーのみです。詳細については、「モデルアーティファクトのエクスポート」を参照してください。
-
(オプション) コラボレーションメンバーは、ML 入力チャネル、トレーニング済みモデル ARN、推論設定済みモデルアルゴリズムを使用してモデル推論を呼び出します。推論結果は推論出力レシーバーに送信されます。推論結果を受け取ることができるのは、有効な ML 設定と推論出力を受け取るメンバーのみです。
モデルプロバイダーが完了する必要がある手順は次のとおりです。
-
SageMaker AI 互換の Amazon Docker ECR イメージを作成します。Clean Rooms ML は SageMaker 、AI 互換のドッカーイメージのみをサポートしています。
-
SageMaker AI 互換の Docker イメージを作成したら、そのイメージを Amazon にプッシュしますECR。「Amazon Elastic Container Registry ユーザーガイド」の指示に従って、コンテナトレーニングイメージを作成します。
-
Clean Rooms ML で使用するモデルアルゴリズムを設定します。
-
Amazon ECRリポジトリリンクと、モデルアルゴリズムの設定に必要な引数を指定します。
-
Clean Rooms ML が Amazon ECRリポジトリにアクセスできるようにするサービスアクセスロールを提供します。
-
設定されたモデルアルゴリズムをコラボレーションに関連付けます。これには、コンテナログ、障害ログ、 CloudWatch メトリクスのコントロール、およびコンテナ結果からエクスポートできるデータ量に関する制限を定義するプライバシーポリシーの提供が含まれます。
-
カスタム ML モデルとコラボレーションするためにデータプロバイダーが完了する必要がある手順は次のとおりです。
-
カスタム分析ルールを使用して既存の AWS Glue テーブルを設定します。これにより、事前に承認されたクエリまたは事前に承認されたアカウントの特定のセットでデータを使用できます。
-
設定済みテーブルをコラボレーションに関連付け、 AWS Glue テーブルにアクセスできるサービスアクセスロールを提供します。
-
設定済みモデルアルゴリズムの関連付けが設定済みテーブルにアクセスできるようにするコラボレーション分析ルールをテーブルに追加します。
-
モデルとデータが Clean Rooms ML で関連付けられて設定されると、クエリを実行できるメンバーは SQL クエリを提供し、使用するモデルアルゴリズムを選択します。
モデルトレーニングが完了すると、そのメンバーはモデルトレーニングアーティファクトまたは推論結果のエクスポートを開始します。これらのアーティファクトまたは結果は、トレーニングされたモデル出力を受け取ることができるメンバーに送信されます。結果レシーバーは、モデル出力を受け取るMachineLearningConfiguration
前に を設定する必要があります。