クラウドパフォーマンス・ベンチマークの重要ポイント

による投稿 2019年12月17日
2020年3月11日

デジタル変革への取り組みを推進している企業は、クラウド環境・サービスに関する調査と戦略立案を実施しています。これは、エンドユーザーのサービス接続性の改善と、自営データセンター運用に関連するコスト削減を目的としています。

ITの意思決定者は、長年にわたって、クラウドのサービスメニュー、価格帯、グローバルデータセンターのロケーションなどの基準に主に基づいてクラウド戦略を策定してきましたが、パフォーマンス比較などの重要な領域のデータは手にすることができませんでした。つまり、自前のITインフラと組み合わせた複雑なマルチクラウド環境を検討することは、多くのIT担当者にとって長年の課題でした。

昨年、3つのパブリッククラウド:Amazon Web Services(AWS)、Google Cloud Platform(GCP)、Microsoft Azureのパフォーマンスに関する業界初の比較評価を実施しました。今年は、IBMクラウドとAlibaba Cloudを比較対象に追加すると同時に、北米のブロードバンドISPのパフォーマンス、中国との接続、AWSのグローバルアクセラレータも調査対象とし、測定数も3億2000万以上のデータポイントに増やしました。

このように、2019年版 Cloud Performance Benchmarkは、クラウドパフォーマンスとクラウドモニタリングに関するユニークかつ第3者視点の公平な比較データを提供します。 このブログでは、この調査で得られた主な調査結果とパフォーマンスの問題がどのようにユーザーに影響するかをご紹介します。

調査結果1:トラフィックを転送するためにインターネットに大きく依存しているクラウドと、そうではないクラウド。 調査対象のクラウドプロバイダーは概ね、同等のネットワーク遅延値を示しましたが、アーキテクチャと接続方法の違いにより、特定のリージョンへのパフォーマンスに差が確認できました。 たとえば、AzureとGCPは広範囲に配置した自社バックボーンを使用して、ユーザーからホスト先のリージョンへのトラフィックを伝送します。 一方、AWSとAlibabaは、ユーザートラフィックの転送をインターネットに大きく依存しており、IBMはハイブリッドなアプローチを採用しています。 インターネットへの依存はパフォーマンスの予測不能性を高めるため、クラウド戦略のリスクを生み出し、運用の複雑さも高めます。よって、パブリッククラウド接続を計画している企業は、インターネットの予測不可能な性質に対する組織側の許容範囲を考慮する必要があります。

図1:クラウド接続のタイプは2つに分類されます。
図1:クラウド接続のタイプは2つに分類されます。

調査結果2:プロバイダー、リージョン、ユーザーロケーションに応じて、大きなクラウドパフォーマンスの差が存在。 5つのクラウドプロバイダーは、北米と西ヨーロッパで同等の堅牢なネットワークパフォーマンスを示しましたが、アジアとラテンアメリカではパフォーマンスの差が表面化しました。たとえば、GCPでは、ヨーロッパからインド・リージョンまでのアクセスにて、AWS、Azure、Alibaba Cloudと比較すると、2.5~3倍のネットワーク遅延を示しました。別の例では、リオからGCPのサンパウロ・リージョンまでのネットワーク遅延は、最適化されていないリバースパスのため、他の3つのクラウドプロバイダーと比較して6倍の結果となりました。よって、各パブリッククラウドからリージョンを選択する場合、企業はユーザーからホスティング先のリージョンまでのパフォーマンスデータを選択基準に含める必要があります。

調査結果3:Alibabaを含むすべてのクラウドプロバイダーは、中国のグレートファイアウォールを通過する際にパフォーマンスの犠牲を払っています。中国市民と世界のインターネットの間には、コンテンツフィルタリングマシンである中国のグレートファイアウォールが存在します。私たちの調査では、中国とのインターネットトラフィックは、どのクラウドホスティング地域を宛先とするかに関係なく、高いパケットロスが発生していることが明らかになっています。

図2:中国のグレートファイアウォールを通過するすべてのクラウドプロバイダートラフィックでパケットロスが見られます。
図2:中国のグレートファイアウォールを通過するすべてのクラウドプロバイダートラフィックでパケットロスが見られます。

調査結果4:AWS Global Acceleratorは、必ずしもインターネットのパフォーマンスを上回るとは限りません。 Global Acceleratorは、AWS内の密に接続されたバックボーンを介して最適化されたルートを使用しますが、パフォーマンスの改善度はグローバルで均一ではありませんでした。多くの場合、Global Acceleratorはパフォーマンスでインターネット接続パスよりも優れていますが、無視できるほどの改善の例やパフォーマンスの低下の例もあります。 Global Acceleratorの採用を検討している企業は、個別にパフォーマンスの向上を検証する必要があります。

調査結果5:米国のブロードバンドISPの選択により、クラウドのパフォーマンスに違いが生じます。ブロードバンドのパフォーマンスはプロバイダー間で比較的一貫していますが、成熟した米国市場でもパフォーマンスに差が見られました。観察した例の1つは、「シアトル、サンノゼ、ロサンゼルスのVerizon接続サイト」からロサンゼルスに位置する「GCP us-west2リージョン」へのトラフィックに関係しています。このシナリオでは、トラフィックが、ロサンゼルスにあるリージョンに戻る前に、ニュージャージーのGoogleバックボーンに入るようにルーティングされていました。この最適化されていないルーティングの結果、予想されるネットワーク遅延が最大10倍になります。ハイブリッドWANの展開を検討している企業は、インターネットの可視性を確保して、このような異常を検出し、ISPまたはクラウドプロバイダーと協力して問題を解決できるようにする必要があります。

図3:VerizonとGCP LA間の最適化されていないピアリング。
図3:VerizonとGCP LA間の最適化されていないピアリング。

クラウドの結果は異なる場合があります。

主要なパブリッククラウドプロバイダーは、エンドユーザーのパフォーマンスと安定性を(できれば)向上させるために、常にネットワークを最適化しています。私たちのテストでは、アマゾンウェブサービス(AWS)のパフォーマンス予測可能性の指標は、特にアジアで顕著に改善され、レイテンシ変動が42%減少しました。ただし、AzureやGCPと比較した場合、AWSはユーザーとの接続に独自のバックボーンを活用するのではなく、インターネットに大きく依存しているため、パフォーマンスの予測可能性は依然として低くなっています。

一方、Google Cloud Platformは、ユーザーからホスト先のリージョンへのトラフィック送信に独自のバックボーンを多く利用します。その結果ほとんどのリージョンで優れた応答時間が得られますが、それでもグローバルで見るといくつかギャップがあります。私たちのテストでは、ヨーロッパとアフリカからのトラフィックがインドに到達するのに2.5~3倍時間がかかり、直接ルートをとるのではなく、地球の裏側を回ることが明らかになりました。また、Google Cloudは内部ネットワークの可視性を低下させたため、ユーザーがネットワークパスとパフォーマンスを理解しにくくなりました。

Microsoft Azureは、独自のバックボーンを積極的に使用してホスティング先のリージョンにユーザートラフィックを運ぶことにより、強力なネットワークパフォーマンスを提供しています。 2018年から2019年の間に、インドではパフォーマンスの予測可能性(ネットワーク遅延)が平均31%低下しましたが、シドニーのパフォーマンス予測可能性は平均50%向上しました。前年比でわずかに減少しましたが、Azureは他のクラウドプロバイダーと比較して、アジアでのパフォーマンスの予測可能性で引き続きリードしています。

今年の調査に追加されたAlibaba CloudとIBM Cloudは、他のクラウドプロバイダーと同等のパフォーマンスを提供していることがわかりました。 Alibaba Cloudは、ユーザートラフィックの大部分を独自のプライベートネットワークバックボーンではなくインターネットに大きく依存している一方、IBMは、ユーザートラフィックがアクセスしている地域に応じて、独自のプライベートバックボーンとパブリックインターネットの両方を使用してトラフィックを配信するハイブリッドアプローチを採用しています。

複雑なクラウドアーキテクチャにはデータドリブンのアプローチが必要

クラウドアーキテクチャは複雑であり、ある企業にとって適切なものが別の企業にとって最適ではない場合があります。 プロバイダー、リージョン、接続方法の選択に関しては、クラウドアーキテクチャは自社のビジネスのレンズを通して構築するのが最適です。 デジタルトランスフォーメーションを採用し、パブリッククラウドに参入する企業にとって、ベンチマークレポートに示されているデータと考察は、クラウドでの運用に関するベストプラクティスと意思決定のデータドリブンガイドとして役に立つ音でしょう。