最高データ責任者向けの Amazon DataZone

Amazon DataZone の概要

最高データ責任者は Amazon DataZone を使用して、ビジネスユーザー、中心的なデータガバナンスチーム、および IT スタッフがデータガバナンスプロセスに参加できるよう支援しています。Amazon DataZone は、チームメンバーとツール間のやりとりを簡素化できます。

ユースケース

サイロを打ち破る

ビジネスチームがビジネス全体のデータを効果的に使用してビジネスプロセスを改善するには、可視性が必要です。ペタバイトのデータが複数の部門、サービス、オンプレミスのデータベース、サードパーティのソース (パートナーソリューションや公開データセットなど) に分散しているため、すべてのデータを可視化するのは難しい場合があります。このデータの価値を最大限に引き出すには、管理者とデータスチュワードがデータにアクセスできるようにする必要があります。ただし、データを管理し、適切な担当者が適切なコンテキストでのみアクセスできるようにする必要があります。Amazon DataZone を使用すると、こうした個々のチームが独自のドメインやビジネスデータカタログを構築できるようになります。組み込み型の生成系人工知能 (AI) を使用して、データをキュレーションすることで、ビジネスデータカタログの分類を充実させることができます。これにより、データを見つけやすく、そして理解しやすくなります。

データ駆動型の意思決定

社内の従業員 (データコンシューマー) は、データプロデューサーからの情報を発見して分析し、意思決定を促進したいと考えています。ただし、データの安全性に保つには、このアクセスを管理する必要もあります。このパラドックスにより、さまざまなデータ、部門、ユースケースを考慮したデータガバナンスポリシーを導入することが困難になっています。Amazon DataZone では、データコンシューマーは必要な情報を見つけ、所有者にアクセスをリクエストします。その後、Amazon DataZone はデータを分析サービスにシームレスにロードできます。その結果、意思決定者は必要な情報をタイムリーに入手して、最新のデータに基づいて意思決定を行うことができます。

データの検出と解釈の強化

データコンシューマーは、自分のユースケースに合ったデータをすばやく簡単に特定できるように、ビジネスコンテキストの詳細な説明と推奨される使用法に関するドキュメントを必要としています。AI が生成するメタデータにより、ユースケースに合ったより価値のあるデータセットを見つけることができ、データプロデューサーとのやり取りに費やす時間を減らすことができます。このメタデータを追加すると、データコンシューマーはデータとそのユースケースとの関連性を把握でき、意図しない目的でデータを誤用することを回避できます。データコンシューマーは、選択したデータが信頼できるもであることを知る必要があります。データ品質スコアを評価し、データリネージを理解することでこれを実現しています。

ビジネスイニシアティブから逆算して、データへのアクセスと制御のバランスを取る

この O'Reilly レポートを読んで、最新のデータガバナンスを必要とするデータ主導型ソリューションを導入する方法を学びましょう。エグゼクティブは、大規模なデータガバナンス管理の複雑さに対処するために必要なインサイトと知識を身につけることができます。

動画

AWS re:Invent 2023 — モダンデータガバナンスのお客様向けパネル (53:46)
AWS re:Invent 2023 — AWS でのアナリティクスと生成系 AI のベストプラクティス (50:13)
AWS re:Invent 2023 - 分析と生成 AI のためのエンドツーエンドのデータ戦略をファニーメイと共に構築 (56:21)

よくある質問

Amazon DataZone はビジネスチームとインフラストラクチャチームのバランスをどのように取っていますか?

Amazon DataZone は、データプロデューサー (データエンジニアとデータサイエンティスト) が主導する使用方法のフライホイールを作成します。データプロデューサーは、データをそのコンテキストとともに組織内の他のユーザーと安全に共有します。次に、データコンシューマー (アナリスト) は、データからビジネスに関する質問に対する答えを見つけ、組織内の他のユーザーと共有します。このワークフローは、データの生成と使用のための分散型データ所有権と統合ガバナンスモデルを構築するのに役立ちます。そこではデータプロデューサーがデータアセットを公開、所有、管理します。データコンシューマーは、データ所有者との承認ワークフローを完了すると、関心のあるデータにアクセスできます。これにより、チームはセルフサービスが可能になり、特定のチームがボトルネックになる可能性を排除することができます。