生成系 AI とは何ですか?

生成 AI (gen AI) は、画像や動画などの新しいコンテンツやアイデアを作成したり、知っている情報を再利用して新たな問題を解決したりできる AI の一種です。

生成 AI とは何ですか?

生成人工知能 (生成 AI または gen AI) は、会話、ストーリー、画像、動画、音楽などの新しいコンテンツやアイデアを生み出すことのできる AI の一種です。人間の言語、プログラミング言語、芸術、化学、生物学など、あらゆる複雑な主題を学習できます。生成 AI は、新たな問題を解決するために、知っていることを再利用します。

例えば、英語の語彙を学習し、処理した単語から詩を作成できます。

組織は、チャットボット、メディア制作、製品開発、設計など、さまざまな目的で生成 AI を使用できます。

新しいプロジェクトで協力する複数の若いビジネスパーソン

生成 AI の例

生成 AI にはさまざまな業界でのユースケースがあります

金融サービス

金融サービス企業は、生成 AI ツールを使用して、コストを削減しながら、より優れたサービスを顧客に提供しています。

  • 金融機関はチャットボットを使用して商品のレコメンデーションを生成し、顧客からの問い合わせに対応して、カスタマーサービス全体を改善しています。
  • 融資機関は、特に発展途上国において、金融サービスが行き届いていない市場で融資の承認のスピードを上げています。
  • 銀行は、請求、クレジットカード、ローンにおける不正行為を迅速に検出します。
  • 投資会社は生成 AI の力を利用して、安全でパーソナライズされた財務アドバイスを低コストでクライアントに提供しています。

AWS での金融サービスにおける生成 AI についてさらに読む

財務の円グラフ

ヘルスケアとライフサイエンス

生成 AI の最も有望なユースケースの 1 つは、創薬と研究を加速することです。生成 AI は、特定の特性を持つ新しいタンパク質配列を作成し、抗体、酵素、ワクチン、遺伝子治療を設計できます。

ヘルスケアおよびライフサイエンス企業は、生成 AI ツールを使用して、合成生物学や代謝工学に応用するための合成遺伝子配列を設計しています。例えば、バイオ製造を目的として、新しい生合成経路を作成したり、遺伝子発現を最適化したりすることができます。

生成 AI ツールは、患者とヘルスケアの合成データも作成します。このデータは、AI モデルのトレーニングや臨床試験のシミュレーションのほか、現実世界の大規模なデータセットにアクセスせずに希少疾患を研究する場合にも役立ちます。

AWS でのヘルスケアとライフサイエンスにおける生成 AI についてさらに読む

地球儀に複数の手が添えられている様子

自動車と製造

自動車会社は、エンジニアリングから車載エクスペリエンス、カスタマーサービスまで、さまざまな目的に生成 AI テクノロジーを使用しています。例えば、機械部品の設計を最適化して車両設計における抵抗を軽減したり、パーソナルアシスタントの設計を適応させたりしています。

自動車会社は生成 AI ツールを活用して、顧客からの極めて一般的な質問に迅速に回答することで、より優れたカスタマーサービスを提供しています。生成 AI は、製造プロセスを最適化したり、コストを削減したりするために、新しい材料、チップ、部品設計を作成します。

もう 1 つの生成 AI のユースケースは、アプリケーションをテストするためのデータの合成です。これは、テストデータセットに含まれることが少ないデータ (欠陥やエッジケースなど) に特に役立ちます。

AWS での自動車業界向けの生成 AI の詳細を読む

AWS での製造業界向けの生成 AI の詳細を読む

自動車と製造

電気通信

通信業界における生成 AI のユースケースは、カスタマーエクスペリエンスの革新に重点を置いています。カスタマーエクスペリエンスは、カスタマージャーニーのあらゆるタッチポイントにおけるサブスクライバーのすべてのやり取りによって形づくられます。

例えば、通信業界の組織は、生成 AI を応用して、人間のようなライブ会話エージェントを使用してカスタマーサービスを改善しています。パーソナライズされた 1 対 1 のセールスアシスタントにより、顧客関係を革新しています。また、ネットワークデータを分析して修正を推奨することで、ネットワークパフォーマンスを最適化しています。 

AWS での通信業界向けの生成 AI の詳細を読む

電気通信

メディアとエンターテインメント

アニメーションや脚本から、完全な映画まで、生成 AI モデルは新しいコンテンツを、従来の制作にかかるコストと時間の数分の一で制作します。

業界における他の生成 AI のユースケースには次が含まれます。

  • アーティストは、AI で生成された音楽でアルバムを補完および強化し、まったく新しいエクスペリエンスを生み出すことができます。
  • メディア組織は、生成 AI を使用してパーソナライズされたコンテンツや広告を提供することでオーディエンスエクスペリエンスを改善し、収益を増やしています。
  • ゲーム企業は、生成 AI を使用して新しいゲームを作成したり、プレーヤーがアバターを作成できるようにしたりしています。
メディアとエンターテインメント

生成 AI の利点

Goldman Sachs によると、生成 AI によって世界の国内総生産 (GDP) が 7% (約 7 兆 USD) 増加し、生産性の伸びが 10 年間で 1.5 %pt 上昇する可能性があります。次に、生成系 AI のメリットをさらにいくつかご紹介します。
生成 AI アルゴリズムは、複雑なデータを新しい方法で探索および分析できるため、研究者は他の方法では明らかにならない可能性のある新しい傾向やパターンを発見できます。このアルゴリズムにより、内容を要約し、複数のソリューションパスの概略を示し、アイデアをブレインストーミングし、研究メモから詳細な文書を作成することができます。これが、生成系 AI が研究とイノベーションを劇的に向上させられる理由です。例えば、製薬業界では生成系 AI システムを使って、タンパク質配列を生成および最適化し、創薬を大幅に高速化しています。
生成系 AI は、人間の会話に自然に応答し、顧客サービスや顧客ワークフローのパーソナライズのためのツールとして機能します。例えば、AI 搭載のチャットボット、ボイスボット、バーチャルアシスタントを使用すると、顧客に的確に応答して、ファーストコンタクトで解決することができます。厳選されたオファーやコミュニケーションをパーソナライズされた方法で提示することで、顧客エンゲージメントを高めることができます。
生成系 AI を使用すると、あらゆる事業分野で機械学習 (ML) とAIアプリケーションを利用してビジネスプロセスを最適化できます。その技術は、エンジニアリング、マーケティング、カスタマーサービス、財務、営業など、あらゆる事業分野に応用できます。例えば、生成 AI は最適化を実現するために次のことを行うことができます: • ナレッジ検索機能のために、あらゆるソースからデータを抽出して要約します。• マーケティング、広告、財務、ロジスティクスなどの分野で、コスト削減のためにさまざまなシナリオを評価して最適化します。• 合成データを生成して、教師あり学習や他の ML プロセスのためにラベル付きデータを作成します。
生成系 AI モデルは、従業員のワークフローを強化し、組織内の全従業員の効率性を高めるアシスタントになることができます。検索から作成まで、どのような作業も人間と同じように行えます。生成 AI は、さまざまなタイプの労働者の生産性を高めることができます: • 特定の入力と制約に基づいて複数のプロトタイプを生成することにより、創造的なタスクをサポートします。また、人間のフィードバックや指定された制約に基づいて既存の設計を最適化することもできます。• アプリケーション開発タスク向けに、新しいソフトウェアコードの提案を生成します。• レポート、要約、予測を生成して管理をサポートします。• マーケティングチームのために、新しいセールススクリプト、E メールコンテンツ、ブログを生成します。組織全体で時間を節約し、コストを削減して、効率を高めることができます。

生成系 AI 技術はどのように進化してきたのか?

プリミティブ生成モデルは、数値データ分析を支援するために統計学で何十年も用いられてきました。ニューラルネットワークと深層学習は、モダンな生成系 AI の呼び水になりました。2013 年に開発された変分オートエンコーダー (VAE) は、リアルな画像と音声を生成できる最初の深層生成モデルでした。

VAE

VAE (変分オートエンコーダー) により、複数のデータ型の新しいバリエーションを作成できるようになりました。これにより、敵対的生成ネットワークや拡散モデルなど、他の生成系 AI モデルが次々に登場しました。このようなイノベーションの重点は、人工的に作成されたにもかかわらず、実際のデータにより近いデータを生成することに置かれていました。

生成 AI モデル

トランスフォーマー

2017 年、トランスフォーマーの導入により、AI 研究にさらなる新風が吹きました。トランスフォーマーにより、エンコーダーとデコーダーのアーキテクチャがアテンションメカニズムとシームレスに統合されました。トランスフォーマーは言語モデルのトレーニングプロセスを非常に効率的かつ汎用的に合理化しました。GPT のような注目すべきモデルは、幅広い未加工テキストのコーパスで事前トレーニングを行い、さまざまなタスクに合わせて微調整できる基盤モデルとして登場しました。

トランスフォーマーは、自然言語処理の可能性を変えました。これにより、翻訳や要約から質問への回答まで、さまざまなタスクに対応する生成機能が強化されました。

生成 AI のブロック

今後の展望

多くの生成系 AI モデルは大きな進歩を続けており、業界を超えた応用の仕方が見出されました。最近のイノベーションは、独自のデータを処理するようにモデルを改良することに重点を置いています。研究者はまた、ますます人間に近いテキスト、画像、動画、音声を作成したいと考えています。

生成 AI の未来

生成 AI の仕組みは?

すべての人工知能と同様に、生成 AI は機械学習モデル、つまり膨大な量のデータで事前にトレーニングされた非常に大規模なモデルを使用して動作します。

基盤モデル

基盤モデル (FM) は、一般化されたデータやラベル付けされていないデータに基づいて広範囲にトレーニングされた ML モデルです。基盤モデルはさまざまな一般的なタスクを実行できます。

FM は、何十年にもわたって進化してきたテクノロジーにおける最新の進歩の結果です。一般に、FM は学習したパターンと関係を使用してシーケンス内の次の項目を予測します。

たとえば、画像生成では、モデルは画像を分析し、より鮮明で明確に定義された画像を作成します。同様に、テキストの場合、モデルは前の数単語とそれらのコンテキストに基づいて、テキスト文字列内の次の単語を予測します。そのあと、確率分布手法を使用して次の単語を選択します。

大規模言語モデル

大規模言語モデル (LLM) は FM の 1 つのクラスです。例えば、OpenAI の生成事前トレーニング済みトランスフォーマー (GPT) モデルは LLM です。LLM は、要約、テキスト生成、分類、自由形式の会話、情報抽出などの言語ベースのタスクに特に重点を置いています。

GPT について読む »

LLM が特別なのは、複数のタスクを実行できる点です。これを実現できるのは、高度な概念を学習できるようにする多くのパラメータが含まれているからです。

LLM は、GPT-3 のようなに、何十億ものパラメータを考慮でき、ごくわずかな入力からコンテンツを生成できます。事前トレーニングでさまざまな形式や無数のパターンのインターネットスケールのデータに触れることで、LLM は幅広いコンテクストで知識を応用することを学習します。

生成系 AI モデルの仕組み

従来の機械学習モデルは、識別的であったり、データポイントの分類に重点が置かれていたりし、既知の要因と未知の要因の関係を特定しようとしました。例えば、ピクセルの配置、線、色、形状などの既知のデータである画像を見て、未知の要素である単語にマッピングします。数学的には、これらのモデルは、未知の要因と既知の要因を x 変数と y 変数として数値的にマッピングできる方程式を特定することで機能しました。生成モデルはこれをさらに一歩進めます。特定の特徴が与えられたときにラベルを予測するのではなく、特定のラベルが与えられたときに特徴を予測しようとします。数学的には、生成モデリングは x と y が同時に発生する確率を計算します。さまざまなデータの特徴の分布とそれらの関係を学習します。例えば、生成モデルは動物の画像を分析して、さまざまな耳の形、目の形、尾の特徴、皮膚のパターンなどの変数を記録します。それぞれの動物の特徴や関係を学び、さまざまな動物が一般的にどのような姿形をしているのかを理解します。その後、トレーニングセットに含まれていなかった新しい動物の画像を再現できます。次に、生成系 AI モデルの大まかなカテゴリーをいくつか示します。

拡散モデル

拡散モデルは、初期データサンプルに制御されたランダムな変更を繰り返し加えることにより、新しいデータを作成します。元のデータから始めて微妙な変化 (ノイズ) を加え、徐々に元のデータとの類似度が低下していきます。このノイズは、生成されたデータが一貫性があり現実的な状態に保たれるように注意深く制御されています。

数回反復してノイズを追加した後、拡散モデルはプロセスを逆転させます。逆のノイズ除去によりノイズが徐々に除去され、元のデータに似た新しいデータサンプルが生成されます。

拡散モデル

敵対的生成ネットワーク

敵対的生成ネットワーク (GAN) は、拡散モデルの概念に基づいて構築された別の生成 AI モデルです。

GAN は、2 つのニューラルネットワークを競争的にトレーニングすることで機能します。ジェネレーターと呼ばれる最初のネットワークは、ランダムノイズを追加して偽のデータサンプルを生成します。ディスクリミネーターと呼ばれる 2 つ目のネットワークは、実際のデータとジェネレーターが生成する偽のデータを区別しようとします。 

トレーニング中、ジェネレーターは現実的なデータを作成する能力を継続的に向上させ、一方ディスクリミネーターは本物と偽物の見分け方が上達します。この敵対的なプロセスは、ディスクリミネーターが実際のデータと区別できないほど説得力のあるデータを生成するまで続きます。

GAN は、リアルな画像の生成、スタイル転送、およびデータ拡張タスクに広く使用されています。

敵対的生成ネットワーク

変分オートエンコーダー

変分オートエンコーダー (VAE) は、潜在空間と呼ばれるデータのコンパクトな表現を学習します。潜在空間は、データを数学的に表現したものです。これは、すべての属性に基づいてデータを表す一意のコードと考えることができます。例えば、顔を学習する場合、潜在空間には目の形、鼻の形、頬骨、耳を表す数字が含まれます。

VAE は、エンコーダーとデコーダーの 2 つのニューラルネットワークを使用します。エンコーダーニューラルネットワークは、入力データを潜在空間の各次元の平均と分散にマッピングします。ガウス (正規) 分布からランダムサンプルを生成します。このサンプルは潜在空間のポイントであり、入力データを圧縮して簡略化したものです。

デコーダーニューラルネットワークは、このサンプリングされたポイントを潜在空間から取得し、元の入力に似たデータに再構築します。数学関数を使用して、再構築されたデータが元のデータとどの程度一致しているかを測定します。

変分オートエンコーダー

トランスフォーマーベースのモデル

トランスフォーマーベースの生成系 AI モデルは、VAE のエンコーダーとデコーダーの概念に基づいています。トランスフォーマーベースのモデルは、エンコーダーにレイヤーを追加して、理解、翻訳、クリエイティブライティングなどのテキストベースのタスクのパフォーマンスを向上させます。

トランスフォーマーベースのモデルはセルフアテンションメカニズムを使用しています。シーケンス内の各要素を処理する際に、入力シーケンスのさまざまな部分の重要性を比較検討します。

もう 1 つの重要な特徴は、これらの AI モデルがコンテキスト埋め込みを実装していることです。シーケンス要素のエンコーディングは、要素自体だけでなく、シーケンス内のコンテキストにも依存します。

トランスフォーマーベースのモデルの仕組み

トランスフォーマーベースのモデルがどのように機能するかを理解するには、文を一連の単語として想像してみてください。

セルフアテンションは、モデルが各単語を処理する際に関連する単語に集中するのに役立ちます。トランスフォーマーベースの生成モデルでは、「アテンションヘッド」と呼ばれる複数のエンコーダーレイヤーを採用して、単語間のさまざまなタイプの関係を捉えています。各ヘッドは入力シーケンスのさまざまな部分を扱うことを学習し、モデルがデータのさまざまな側面を同時に考慮できるようにします。

また、各レイヤーではコンテキストに応じた埋め込みも洗練され、より有益な情報が得られ、文法構文から複雑な意味に至るまで、あらゆる情報が取り込まれます。

トランスフォーマーベースのモデル

初心者のための生成 AI トレーニング

生成 AI トレーニングは、基本的な機械学習の概念を理解することから始まります。学習者は、ニューラルネットワークと AI アーキテクチャについても学ぶ必要があります。TensorFlow や PyTorch などの Python ライブラリの実践的な経験は、さまざまなモデルを実装および実験するために不可欠です。また、モデルの評価、ファインチューニング、プロンプトエンジニアリングのスキルも学ぶ必要があります。

人工知能または機械学習の学位の取得過程では、詳細なトレーニングを受けることができます。専門能力の開発のために、オンラインの短期コースの受講や認定の取得を検討してください。AWS での生成 AI トレーニングには、次のようなトピックに関する AWS エキスパートによる認定が含まれます:

 

初心者のための生成 AI トレーニング

生成 AI にはどのような制限がありますか?

生成 AI システムは、その進歩にもかかわらず、不正確または誤解を招くような情報を生成することがあります。同システムはトレーニングされたパターンやデータに依存しており、そのデータに内在する偏りや不正確さを反映している場合があります。トレーニングデータに関するその他の懸念事項には以下があります

セキュリティ

独自のデータを使用して生成 AI モデルをカスタマイズすると、データのプライバシーとセキュリティ上の懸念が生じます。生成 AI ツールが、専有データへの不正アクセスを制限するような応答を生成するように努力する必要があります。AI モデルの意思決定方法に説明責任と透明性が欠けていると、セキュリティ上の懸念も生じます。
AWS を使用した生成 AI への安全なアプローチについて学ぶ

創造性

生成 AI はクリエイティブなコンテンツを作成できますが、本当の意味でのオリジナリティに欠けていることがよくあります。AI の創造性は、トレーニングされたデータによって制限されるため、アウトプットが反復的だったり、派生的だったりするかもしれません。より深い理解と感情的な共鳴を伴う人間の創造性を、AI が完全に再現することは依然として困難です。

コスト

生成 AI モデルのトレーニングと実行には、かなりのコンピューティングリソースが必要です。クラウドベースの生成 AI モデルは、新しいモデルをゼロから構築するよりも利用しやすく、手頃な価格です。

説明可能性

生成 AI モデルは複雑で不透明なため、ブラックボックスと見なされることがよくあります。このようなモデルがどのようにして特定のアウトプットに到達するかを理解することは困難です。信頼と採用を高めるには、解釈可能性と透明性の向上が不可欠です。

生成系 AI を採用する際のベストプラクティスとは?

組織が生成系 AI ソリューションを実装したい場合は、以下のベストプラクティスにより取り組みを強化することをご検討ください。
生成系 AI の採用は、プロセスの最適化と従業員の生産性に重点を置いた社内アプリケーションを開発するところから始めるのが最適です。より制御された環境で結果をテストしながら、スキルとテクノロジーの理解を深めることができます。モデルを広範囲にテストし、社内のナレッジソースでカスタマイズすることもできます。こうすることで、最終的にモデルを外部アプリケーションに使用するときに、顧客のエクスペリエンスが大幅に向上します。
すべての生成 AI アプリケーションとアウトプットについて明確に伝えることで、ユーザーは自分が人間ではなく AI と対話していることを知ることができます。例えば、AI は自らを AI として紹介したり、AI ベースの検索結果をマークして強調表示したりできます。そうすれば、ユーザーは自分の判断でコンテンツを利用できるようになります。また、トレーニングデータの制限により基礎となるモデルに生じる可能性のある不正確さや隠れたバイアスに、ユーザーはより積極的に対処できるようになる可能性があります。
ガードレールを実装して、生成系 AI アプリケーションで機密データへの不注意による不正アクセスが許可されないようにしましょう。最初からセキュリティチームを巻き込んで、最初から全側面を検討できるようにしましょう。例えば、内部データでモデルをトレーニングする前に、データをマスクして個人を特定できる情報 (PII) を削除する必要がある場合があるでしょう。
自動および手動のテストプロセスを開発して結果を検証し、生成 AI システムが経験する可能性のあるあらゆる種類のシナリオをテストしましょう。さまざまなベータテスターのグループを用意して、さまざまな方法でアプリケーションを試し、結果を文書化しましょう。また、テストを通じてモデルが継続的に改善され、期待される結果や応答をより細かく制御できるようになります。

AWS は生成系 AI をどのように支援できますか?

Amazon Web Services (AWS) では、データ、ユースケース、顧客向けの生成系 AI アプリケーションを簡単に構築してスケーリングできます。AWS での生成 AI を使用すると、エンタープライズグレードのセキュリティとプライバシー、業界をリードする FM へのアクセス、生成 AI を活用したアプリケーション、データファーストのアプローチを実現できます。

よくある質問

基盤モデルは、幅広いテキストおよび画像データでトレーニングされた大規模な生成 AI モデルです。質疑応答、エッセイの作成、画像のキャプション付けなど、さまざまな一般的なタスクを実行できます。
生成 AI は、特に敵対的生成ネットワーク (GAN) やトランスフォーマーなどのモデルによる深層学習の進歩により、2010 年代後半に登場しました。生成 AI は、クラウドコンピューティングの進歩により商業的に実現可能になり、2022 年から使用できるようになりました。
人工知能は、機械をより人間らしくするという、広範な概念です。Alexa、チャットボット、画像ジェネレーターなどのスマートアシスタントから、ロボット掃除機や自動運転車まで、あらゆるものが含まれます。生成 AI は、有意義かつインテリジェントな新しいコンテンツを生成するサブセットです。