このアップデートの要点
AWS Resilience Hubの次世代版が発表され、大幅に拡張されたエクスペリエンスが提供されます。これには、新しいアプリケーションモデル、依存関係検出アセスメント、生成AIを活用した障害モード分析、モジュラーレジリエンスポリシー、そして組織全体のレポート機能が含まれます。これにより、SRE(Site Reliability Engineers)や開発チームは、レジリエンスポリシーの期待値を構造的に合わせ、それらを達成し、テストを通じてコンプライアンスを実証するための方法を得られます。
背景にある技術トレンド
多くの組織が数百ものアプリケーションを運用する中で、可用性は最重要課題ですが、レジリエンス目標の設定、進捗測定、ポートフォリオ全体でのコンプライアンス証明に一貫した方法がありませんでした。チームごとに異なる基準やツールが使用され、アプリケーションが期待どおりのパフォーマンスを発揮しているかどうかの情報交換に苦労していました。この次世代版AWS Resilience Hubは、AWS Organizationsとの統合により、エンタープライズ規模でのレジリエンス評価、障害モードの特定、隠れた依存関係の検出、進捗状況の報告を可能にします。
影響と今後の見通し
次世代のAWS Resilience Hubは、レジリエンスジャーニーを段階的に案内します。主な概念として、以下のものが組み込まれています。
- レジリエンスポリシー: モジュラーでコンポーザブルな要件を通じてレジリエンスの期待値を定義できます。単一の固定されたポリシータイプを選択するのではなく、サービスレベル目標(SLO)、マルチAZおよびマルチリージョン災害復旧、データリカバリ要件など、アプリケーションにとって重要な要件を選択してポリシーを構築します。
- ビジネスレベルの理解: ビジネス成果に直接マッピングされるクリティカルエンドユーザーパスを通じた新しいアプリケーションモデリングを使用できます。システムはビジネスアプリケーションを表し、ユーザーエクスペリエンスはクリティカルなビジネスパスを記述し、サービスはAWSリソース、コード、オブザーバビリティで構成されるデプロイ可能なユニットです。Resilience Hubはこれらを自動的に検出し、リソースがどのように接続されているかを示すトポロジーにマッピングします。
- AI障害モードアセスメント: 定義されたレジリエンスポリシー、AWS Well-Architectedベストプラクティス、およびAWS Resilience Analysis Frameworkに対してサービスを分析する、生成AIを活用したアセスメントを実行できます。これらのアセスメントは、潜在的な障害モードを特定し、実行可能な推奨事項を提供します。
- 依存関係検出アセスメント: サービスが依存するAWSサービス、内部エンドポイント、サードパーティエンドポイントを自動的に検出できます。この依存関係アセスメントは、DNSクエリログ分析を使用して、予期しないクロスリージョンコールやクリティカルなサードパーティ依存関係など、把握していない可能性のある依存関係を特定します。
利用を開始するには、レジリエンスポリシーを設定し、最初のシステムとサービスをセットアップし、障害モードアセスメントを実行し、結果を確認して、発見事項を実装します。開始前に、Resilience HubにAWSリソースへの読み取り専用アクセス権を付与するインボーカーIAMロール、クロスアカウントロール(AWS Organizationsを使用しない場合)、またはAWS Organizationsと連携するサービスリンクロール(SLR)を設定する必要があります。Resilience HubはAWS Organizationsとも統合されており、単一の委任管理者アカウントから組織全体のレジリエンス管理を可能にします。これにより、エンタープライズ全体でレジリエンス体制を評価するために個々のアカウントにログインする必要がなくなります。
レジリエンスポリシーを設定するには、AWS Resilience Hubコンソールを通じて「ポリシー」メニューで「ポリシーの作成」を選択します。ポリシー名、説明を入力し、レジリエンス要件を選択します。例えば、金融アプリケーションで使用されるマルチリージョン災害復旧のための再利用可能なポリシーを作成できます。これには、99.95%の可用性SLO、15分RTO、マルチリージョン災害復旧のための5分RPO、およびRTOとRPO要件に沿った災害復旧アプローチが含まれます。データリカバリ要件を選択した場合、このポリシーに関連付けられた各サービスについて、バックアップからの復元に必要なデータリカバリタイムオブジェクトを定義できます。
ビジネスアプリケーションを表す最初のシステムを作成するには、「システム」メニューで「システムの作成」を選択します。オプションで、このシステムに対してAWS Organizationsアカウントアクセスを有効にできます。次に、マイクロサービスのようなデプロイ可能なユニットを表すサービスを作成し、それをシステムに関連付け、リソースの場所をResilience Hubに指示できます。サービス名(例: stock-exchange-service)を入力し、レジリエンスポリシーとインボーカーAWS IAMロール名を選択します。サービスリージョン、リソースタグなどのサービスリソース、AWS CloudFormationスタック、Terraform状態ファイルの位置、またはAmazon EKSクラスターと名前空間を選択できます。このサービスに対して依存関係検出を有効にすると、AWSはサービスのリソースに関連付けられたVPCのVPCクエリログを調べます。この機能は、サービスの詳細ページにある依存関係検出設定からいつでも無効にできます。
サービス作成が完了し、ポリシーが適用されたら、最初の評価を実行できます。サービスページで「障害モードアセスメントの実行」を選択し、アセスメントが完了するのを待ちます。アセスメント中、Resilience Hubはインボーカーロールを引き受け、設定された入力ソースからリソースを読み取り、親子関係を特定し、アプリケーショントポロジーサービスにクエリを実行してリソース間の接続をマッピングし、データフロー、包含、および権限を示すトポロジーを構築します。「サービストポロジー」を選択すると、グラフ、テーブル、またはJSON形式でサービス機能別にグループ化されたサービスリソースを確認できます。「障害モードガイダンス」を選択すると、エージェントをガイドするために使用されるアサーションを追加できます。
まとめ
AWS Resilience Hubの次世代版は、生成AIを活用した障害モード分析や依存関係検出などの新機能により、SREチームがエンタープライズ規模でレジリエンスを管理し、向上させるための強力なツールを提供します。モジュラーレジリエンスポリシーとビジネス成果に直結したアプリケーションモデリングにより、組織はレジリエンス目標を明確にし、コンプライアンスを実証することが容易になります。
Related Certifications
この記事に関連する技術領域の認定資格
AWS 関連資格
- AWS Certified Cloud Practitioner
- AWS Certified Solutions Architect – Associate
- AWS Certified Developer – Associate
- AWS Certified Solutions Architect – Professional
- AWS Certified DevOps Engineer – Professional
- AWS Certified Machine Learning – Specialty
※ 認定資格は技術スキルの体系的な学習に役立ちます。試験の出題範囲や受験要件は変更される場合があるため、受験前に必ず公式サイトで最新情報をご確認ください。
PR / Recommended
生成AIを体系的に学べるスクール
生成AIやプロンプトエンジニアリングを実務で活かしたいエンジニア・ビジネスパーソンには、専門スクールでの体系的な学習が効率的です。DMM 生成AI CAMPは月額定額で学び放題、無料セミナーも開催中です。
SF Tech & Win
Salesforce × AWS × AI 連携の実装ノウハウ
SIer・スタートアップ・中小企業のDX推進に役立つアーキテクチャ事例・実装パターン・最新アップデート情報を毎朝配信。


コメント