Well-Architected Frameworkは、安全で、パフォーマンス、レジリエンス、および効率に優れたクラウドベースのインフラストラクチャの構築と運用を支援するために、クラウドプロバイダーによって開発された方法論です。クラウドベースのソリューションのアーキテクチャの評価、設計、改善に使用できる一連のベストプラクティス、ガイドライン、およびツールからなります。
Well-Architected Frameworkは、コスト最適化、セキュリティ、信頼性、オペレーショナルエクセレンス、パフォーマンス効率、持続可能性という6つの柱を中心に構成されています。各柱は、Well-Architectedな(適切に設計された)システムのさまざまな側面を表しており、企業がシステムを設計および評価する際に指針となる一連の原則、考慮事項、および質問を含んでいます。
Well-Architected Frameworkが重要である理由
Well-Architected Frameworkを使用すると、企業はクラウドサービスの価値を最大化しながら、リスクを最小限に抑えることができます。また、クラウドベースのソリューションの品質と効率を高め、クラウドリソースの使用を最適化し、より良いビジネス成果を実現できます。
リスクの最小化を支援:クラウドベースのソリューションに関連するリスクの特定と緩和を可能にします。これは、セキュリティ侵害、システムダウンタイム、および事業活動に影響を及ぼす可能性があるその他の問題のリスクを最小限に抑えるのに役立ちます。
スケーラビリティと柔軟性を確保:パフォーマンスや可用性を犠牲にすることなく、ビジネスニーズの変化に適応し、ワークロードの増加に対処できるようにするスケーラブルで柔軟なソリューションの設計を支援します。/p>
リソース使用を最適化:クラウドリソースの使用を最適化して、コスト削減と効率向上を実現できます。Well-Architectedなソリューションを設計することで、リソースへの不必要な支出を回避し、投資収益率を改善できます。
パフォーマンスと信頼性を向上:可用性、耐障害性、およびパフォーマンスの高いアプリケーションとワークロードを構築します。これは、予期しないイベントや需要の変動が発生した場合もアクセス性や応答性を確保するのに役立ちます。
コンプライアンスを促進:規制要件やコンプライアンス要件への対応に関するガイダンスにより、高額な罰金や法的問題を回避するのに役立ちます。
Well-Architected Frameworkの6つの柱
1. オペレーショナルエクセレンス
オペレーショナルエクセレンスとは、顧客にビジネス価値を提供するために、システムを効果的かつ効率的に実行し、管理することです。これには、運用プロセスの継続的改善、パフォーマンスの監視と測定、リスクや問題の予防的な特定と緩和が含まれます。オペレーショナルエクセレンスの主要な側面は以下のとおりです。
- 準備:明確な達成目標を設定し、役割と責任を定義し、効果的なコミュニケーション/コラボレーションチャネルを構築します。
- 運用:システムの展開、監視、および管理のための標準化された再現可能なプロセスを定義し、実施します(自動化や文書化など)。
- 変更管理:システムの変更を管理するための正式なプロセスを実施します(テスト、検証、および承認手順など)。
- インシデント管理:インシデントの検知、対応、および解決手順を確立します(エスカレーションパス、コミュニケーション計画、事後分析など)。
- 継続的改善:システムパフォーマンスの監視と測定、改善すべき領域の特定、およびフィードバックや指標に基づく変更の実施のためのプロセスを実施します。
基本的に、現在の要件に基づいて最も有力なSASEのユースケースを特定し、導入の潜在的な落とし穴のほか、組織およびインフラストラクチャの制約も理解する必要があります。
2. セキュリティ
セキュリティの柱は、セキュリティコントロールの設計と実装に関するベストプラクティスに従って、データの機密性、完全性、可用性を含む情報とシステムを保護することに関係します。これは、以下に示す主要な原則に従うことによって実現されます。
- 強力なアイデンティティ基盤の実装:適切なアイデンティティおよびアクセス管理を実装します(認証管理、許可管理、権限管理など)。
- すべての層でのセキュリティの適用:アーキテクチャのすべての層にセキュリティコントロールを適用します(アプリケーション層、ネットワーク層、データ層など)。
- セキュリティベストプラクティスの自動化:セキュリティコントロールとベストプラクティスを自動化してヒューマンエラーを削減し、一貫性を高めます。
- 伝送中および保管中のデータの保護:暗号化やその他のセキュリティコントロールを実装して伝送中および保管中のデータを保護します。
- 安全なアプリケーション設計の確保:アプリケーション開発にセキュアコーディング手法や脆弱性テストを取り入れます。
- セキュリティイベントの監視と対応:セキュリティイベントの監視・対応プロセスを確立します(インシデント対応計画/テストなど)。
3. 信頼性
信頼性の重視は、システムが意図したとおりに動作し、顧客や関係者のニーズを満たすことを確実にします。これは、可用性、耐障害性、およびレジリエンスの高いシステムの設計と実装を意味します。信頼性は、以下に示す主要な原則に従うことによって実現できます。
- 障害に備えた設計:障害に耐え、障害がユーザーや関係者に及ぼす影響を最小限に抑えるシステムを設計します。
- 自動復旧の実装:自動復旧メカニズムを実装してダウンタイムを最小限に抑え、サービスを迅速に復旧します。
- 水平方向へのスケーリング:需要やトラフィックの変化に対応して水平方向にスケーリングできるシステムを設計します。
- 信頼性のテスト:システムの信頼性を保証するテスト戦略を実施します(負荷テスト、ストレステスト、カオスエンジニアリングなど)。
- 変更の管理:システムの変更を管理するためのプロセスを実施します(テスト、検証、承認手順など)。
- イベントの監視と対応:イベントの監視と対応のためのプロセスを確立します(アラートや通知、インシデント対応計画/テストなど)。
4. パフォーマンス効率
パフォーマンス効率とは、システムがコンピューティングリソースを効率的に使用してパフォーマンス要件を満たす能力を意味します。これには、所期のレベルのパフォーマンス、スケーラビリティ、可用性を実現するための処理、ストレージ、およびネットワークリソースの最適化が含まれます。優れたパフォーマンス効率を達成するには、以下の設計原則を考慮する必要があります。
- 適切なリソースの選択:アプリケーションのワークロード要件に適合する適切なリソースとサービスを選択します(メモリ、CPU、ストレージなど)。
- スケーラビリティ:システムがパフォーマンスに影響を与えることなくトラフィックの突然の急増に対処できるように、需要に応じてスケールアップまたはスケールダウンできるシステムを設計します。
- パフォーマンスモニタリング:パフォーマンスのボトルネックの特定、使用傾向の追跡、パフォーマンス要件が満たされていることの確認のために監視機能とアラートを実装します。
- 最適化:パフォーマンスの問題を特定し、対処することによってシステムを継続的に最適化します(レイテンシーの短縮、応答時間の改善、リソース使用の最適化など)。
5. コスト最適化
コスト最適化とは、クラウド上でのワークロードの実行に関連するコストを最適化するためのプロセスを意味します。これには、無駄の特定と排除、費用対効果の高いソリューションの特定、リソースが効率的に使用されていることの確認などが含まれます。コスト最適化を実現するには、以下の設計原則を考慮する必要があります。
- コストを意識したアーキテクチャ:ワークロード要件に適合する適切なサービスとリソースを選択することにより、コストが最適化されたアーキテクチャを設計します。
- 適切なサイジング:インスタンス、ストレージ、データベースなどのリソースをワークロード要件に合わせて適切にサイジングして、オーバープロビジョニングやアンダープロビジョニングを回避します。
- 使用の最適化:オートスケーリング、リザーブドインスタンス、スポットインスタンスなどの機能を活用したり、アクセス頻度の低いデータにはGlacierなどの低コストストレージクラスを使用したりして、リソースの使用を最適化します。
- 無駄の管理:十分に活用されていないリソースや未使用リソースを排除し、リソースの統合、オーバープロビジョニングの回避によって無駄を管理します。
6. 持続可能性
持続可能性は、クラウドベースのソリューションが環境に責任を持ち、企業の二酸化炭素排出量の削減に貢献することを目的としているため、このフレームワークにおける重要な考慮事項です。持続可能性を促進するWell-Architected Frameworkの主要な側面は以下のとおりです。
- リソースの最適化:自動化ツールを使用して需要に応じてリソースをスケールアップ/スケールダウンすることにより、必要なリソースのみを使用し、エネルギーの無駄につながる可能性があるオーバープロビジョニングを回避できます。
- 効率的な設計:効率的でエネルギー消費を最小限に抑えるクラウドベースのソリューションを設計することが重要です。例えば、サーバーレスアーキテクチャを使用すると、リソースが必要な場合にのみ使用されるため、インフラストラクチャの必要性を減らしてエネルギー消費を削減できます。
- 再生可能エネルギー:企業は、データセンターへの電力供給に再生可能エネルギー源を使用するクラウドプロバイダーを利用することが奨励されます。これは事業の二酸化炭素排出削減に役立ち、より持続可能な未来に貢献できます。
- グリーンイニシアチブ:企業は、クラウドベースのソリューションを含め、ビジネスのあらゆる分野でグリーンイニシアチブを実施することにより、持続可能性に包括的にアプローチすることが奨励されます。これには、ハードウェアへの持続可能な素材の使用、在宅勤務やリモートワークの促進による二酸化炭素排出削減、リサイクルや廃棄物削減の促進などが含まれます。
Well-Architected Frameworkを実践することの主なメリット
以下は、企業がWell-Architected Frameworkに沿ってクラウドベースのシステムを構築することの主なメリットです。
- セキュリティポスチャーの改善:クラウドインフラストラクチャ内の潜在的なセキュリティ脆弱性を特定でき、それらを緩和する方法に関するガイダンスが得られます。ベストプラクティスに従って、必要なセキュリティコントロールを実装することにより、全体的なセキュリティポスチャーを改善できます。
- 一貫したセキュリティプラクティス:クラウドインフラストラクチャ全体にわたって一貫したセキュリティアプローチを採用することにより、すべてのチームやアプリケーションが同じセキュリティプラクティスに従うことになり、セキュリティギャップや見落としのリスクが軽減されます。
- リスクの軽減:セキュリティポスチャーの改善により、潜在的なセキュリティリスクが実際のセキュリティインシデントに発展する前に容易に緩和できます。ひいては、データ漏えい、データ喪失、その他のセキュリティインシデントのリスクが軽減されます。
- コンプライアンス:GDPRやHIPAAなどの多くの規制フレームワークは、企業にセキュリティコントロールの実装やベストプラクティスの実践を義務付けています。Well-Architected Frameworkを実践することにより、これらのコンプライアンス要件を確実に満たすことができます。
- コスト削減:多大な損失をもたらすダウンタイム、セキュリティ侵害、その他のサイバーセキュリティ関連の問題を回避します。これは、長期的にはコスト削減とコストの効率的な管理に役立ちます。
- 信頼性:耐障害性に優れたクラウドベースのシステムを設計・構築します。これには、冗長コンポーネントの実装や、複数のアベイラビリティゾーンにわたるシステムのデプロイなどが含まれます。
- 持続可能性:ESG(環境・社会・ガバナンス)の目標を達成するために、資源の使用を最適化し、無駄を最小限に抑えます。効率的なシステムを設計することにより、環境への影響を軽減し、持続可能性を促進できます。
Well-Architected Frameworkの実践方法
Well-Architected Frameworkの実践は継続的なプロセスであり、継続的な配慮と改善が必要である点に留意することが重要です。以下に示す一般的な手順に従って開始できます。
- 目標の明確化:クラウド環境で達成したいセキュリティ、信頼性、パフォーマンス、およびコスト最適化の具体的な目標を決定します。
- 現在の環境の評価:現在のクラウドインフラストラクチャを評価して、改善可能な領域をWell-Architected Frameworkのすべての柱にわたって特定します。
- ベストプラクティスの特定:Well-Architected Framework、またはクラウド環境に適したその他のフレームワークを入念に調べて、目標達成に役立つベストプラクティスを特定します。
- 改善項目の優先順位付け:事業活動への潜在的な影響に基づいて、差し迫った改善項目に重点を置きます。
- 実践計画の策定:スケジュール、予算、必要なリソースを含め、実践のベストプラクティスを決定します。
- 実践と検証:実践状況を検証して当面の要件やビジネス目標を満たしていることを確認します。
- 監視と反復:クラウド環境を継続的に監視し、必要に応じて実践計画を反復して、目標達成に近づいていることを確認します。
事例
ある大手物流企業は、Azure(POC)サブスクリプション上のAIアプリケーションの管理に関して、複雑化、コンプライアンス違反、維持コストの高騰といった課題に直面していました。そこで、同社はAIアプリケーションを既存のサブスクリプションから新しいAzureサブスクリプションに移行し、Well-Architected Frameworkを採用してクラウドベースのソリューションの信頼性、安全性、効率、およびコスト最適化を図ることにしました。
主な課題
AIアプリケーションをAzureに移行するに当たって、主な課題は自社の事業活動に影響を与えることなくシームレスな移行を確保することでした。加えて、コストを最小限に抑え、セキュリティとコストの最適化目標を達成するために、アプリケーションによるAzureリソースの使用を最適化することも必要でした。
ソリューション
これらの課題を克服するために、同社はLumenのクラウド専門家チームに協力を仰ぎ、移行を計画、設計、実施しました。Lumenは、移行する必要があるAIアプリケーションのコンポーネントを特定し、Azure Virtual Machine、Azure Data Factory(ADF)、Azure SQL Databaseなど、アプリケーションをホストするのに適切なAzureサービスを選択しました。