Amazon SageMaker Ground Truth のよくある質問
全般
Q: ヒューマンインザループとは何ですか? また、AI を活用したアプリケーションの構築にとって重要な理由は何ですか?
ヒューマンインザループとは、機械学習のライフサイクル全体にわたって人間の意見を活用して、モデルの精度と関連性を向上させるプロセスです。人間は、データの生成や注釈付けから、モデルのレビュー、カスタマイズ、および評価まで、さまざまなタスクを実行できます。人間がコンテンツの要求と消費の両方を行う生成 AI アプリケーションでは、人間の介入が特に重要です。したがって、ファンデーションモデル (FM) に、ユーザーのプロンプトに正確かつ安全かつ適切に対応する方法を人間がトレーニングすることが重要です。人間からのフィードバックを応用して、複数のタスクを完了することができます。まず、教師あり学習(モデルがユーザーのプロンプトにどのように反応すべきかのスタイル、長さ、精度を人間がシミュレートする)と人間のフィードバックによる強化学習(人間がモデルの応答をランク付けして分類する)を通じて、生成型 AI アプリケーション向けの高品質のラベル付きトレーニングデータセットを作成します。次に、人間が生成したデータを使用して、特定のタスクや会社、ドメイン固有のデータに合わせて FM をカスタマイズし、モデル出力を目的に即したものにします。最後に、人間による評価と比較を使用して、ユースケースとプロジェクトの要件に最も適した FM を選択します。
Q: Amazon SageMaker Ground Truth のセルフサービスと AWS マネージドサービスの違いは何ですか?
Amazon SageMaker Ground Truth は、最も包括的なヒューマンインザループ機能を備えています。Amazon SageMaker Ground Truth を利用するには、セルフサービスサービスと AWS マネージドサービスの 2 つの方法があります。セルフサービスサービスでは、データアノテーター、コンテンツクリエーター、プロンプトエンジニア(社内、ベンダー管理、または一般ユーザーの活用)は、当社のローコードユーザーインターフェイスを使用して、独自のカスタムワークフローを柔軟に構築および管理しながら、ヒューマンインザループタスクを加速できます。AWS マネージドサービス (SageMaker Ground Truth Plus) では、お客様のユースケースに適した人材の選択と管理など、面倒な作業をお客様に代わって処理します。SageMaker Ground Truth Plus は、エンドツーエンドのワークフロー (詳細な人材トレーニングと品質保証手順を含む) を設計およびカスタマイズし、特定のタスクについてトレーニングを受けた熟練した AWS マネージドチームを提供し、お客様のデータ品質、セキュリティ、コンプライアンス要件を満たします。
Q: FM を活用した生成 AI アプリケーションでは、ヒューマンインザループ機能をどのように活用できるのですか?
ヒューマンインザループ機能は、FM を活用した生成 AI アプリケーションの作成と改善において重要な役割を果たします。タスクのガイドラインに基づいてトレーニングを受けた高度なスキルを持つ人材は、FM を訓練するためのデモンストレーションデータの作成、サンプル応答の修正と改善、企業および業界データに基づくモデルの微調整、毒性や偏見に対する保護手段としての機能などの活動において、フィードバック、ガイダンス、インプット、評価を提供できます。したがって、ヒューマンインザループ機能により、モデルの精度とパフォーマンスを向上させることができます。
Q: Amazon SageMaker Ground Truth の使用を開始するにはどのようにすればよいですか?
Amazon SageMaker Ground Truth Plus (AWS マネージド型サービス) の使用を開始するには、プロジェクト要件フォームに入力してください。担当のチームがお客様のヒューマンインザループプロジェクトについて説明するためにご連絡いたします。
Amazon SageMaker Ground Truth (セルフサービス型サービス) の使用を開始するには、AWS マネジメントコンソールにサインインして、SageMaker コンソールを開きます。そこで、[Ground Truth] の下にある [ラベリングジョブ] を選択します。これで、ラベル付けジョブを作成できます。まず、ラベル付けジョブ作成フローの一部として、ラベルを付けるデータセットを含む S3 バケットへのポインタを指定します。Ground Truth には、一般的なラベル付け作業のためのテンプレートが用意されており、いくつかの選択肢をクリックするだけで、データをラベル付けするための最短のステップを提供します。独自のカスタムテンプレートを作成することもできます。ラベル付けジョブを作成する最後のステップとして、人手による作業について 3 つのオプションから選択します。(1) クラウドソーシングの労働力を利用する、(2) 推奨されるサードパーティーデータラベリングサービスプロバイダーを利用する、(3) 自社従業員が作業する。また、自動データラベリングを有効にするオプションもあります。
Q: Amazon SageMaker Ground Truth は、どのようにしてデータの保護とセキュリティを確保しますか?
デフォルトで、Amazon SageMaker Ground Truth は、Amazon S3 バケットに保存されたデータを、静止時と転送時に暗号化します。さらに、データへのアクセスは AWS Identity and Access Management (IAM) を使用して制御されます。SageMaker Ground Truth は、データを (お客様によって、または AWS マネージド型サービスを通じて作成された) AWS 環境外に保存することやコピーすることはないのでデータの制御は維持されます。さらに、Ground Truth は一般データ保護規則 (GDPR) などのコンプライアンス基準をサポートしているほか、Amazon CloudWatch および Amazon CloudTrail を使用してデータへのすべてのアクセスのログ記録および監査を行います。詳細については、Amazon SageMaker Ground Truth のドキュメントを参照してください。
Q: Amazon SageMaker Ground Truth はどのようにして私のプロジェクトに適した人材を見つけるのですか?
Amazon SageMaker Ground Truth Plus (AWS マネージド型サービス) を使用すると、特定の AI/ML タスクのトレーニングを受けたオンデマンドのワークフォースであるエキスパートにアクセスすること、特定のプロジェクト要件に基づいてワークフローを動的にスケールアップまたはスケールダウンすることができるので、データ品質、セキュリティ、コンプライアンス要件を満たすのに役立ちます。私たちのチームはお客様と協力して、お客様のプロジェクトに必要なスキルを理解し、適切な人材を配置します。
Q: Amazon SageMaker Ground Truth の料金はいくらですか? また、どの AWS リージョンで利用できますか?
最新の料金情報については、SageMaker Ground Truth の料金ページを参照してください。SageMaker Ground Truth Plus プロジェクトの料金は個別に設定されています。プロジェクト要件フォームを送信していただいた後、当社のチームが料金オプションを検討します。
Amazon SageMaker Ground Truth が現在利用可能な AWS リージョンの一覧は、製品およびサービス一覧 (リージョン別) でご確認いただけます。