見出し画像

コンピュテーショナル・ストレージ(CSx)がエッジ環境に適している理由

システムが処理しなければならないデータ量は今もなお継続的に増加しており、この現実は従来のシステムアーキテクチャに過度な負担をまねき、パフォーマンスのボトルネックとなっています。
しかし新たに「コンピュテーショナル・ストレージ」と呼ばれる技術が、これを解決し、さらに以下のようなメリットをもたらしはじめています。
・既存のサーバーの性能向上
・エネルギー効率の向上
・エッジにおける新たな技術的・ビジネス的機会の獲得

コンピュテーショナル・ストレージ(CSx)とは

コンピュテーショナル・ストレージ(CSx)とはストレージデバイスに計算機能を組み込んだアーキテクチャです。
これまでのストレージデバイスに対し、アプリケーションのパフォーマンスを向上し、インフラの効率化を促進する処理能力を付与した高機能強化ストレージデバイスがコンピューテーショナル・ストレージ・デバイスです。

スクリーンショット 2021-09-27 9.43.23

CSxはストレージとメインCPU間のデータの移動を減らすことで、システム全体の計算能力を向上させます。
CSxはオンボードのCPUがスマートNICに与えるメリットと同様に、既存のサーバーに低遅延で効率的な大量データの処理をもたらします。

CSxは「データが存在する場所に計算能力を移動させる」ことに焦点を当てた、システム設計における新たなトレンドの一部です。
このような傾向は大規模なスケールではエッジコンピューティングの進化に見られます。
またネットワークパケットが届く場所の近くに計算機を移動させるスマートNICの台頭も見られます。
これらのシステム設計パターンやマクロ的な計算パターンはすべて、データを常に「集中的な計算する場所」に移動させるのではなく、データが保存・生成される場所に「計算能力を移動させる」という目標に基づいています。
CSxは「データが保存されている場所」で「データを処理する」という選択肢を提供し、システムバスを介してシステムCPUにデータを移動して処理する必要をなくします。

画像2

これらのデバイスが意味を持ち、今日のアプリケーションやインフラ設計で人気を博し始めているのには、いくつかの理由があります。

ホストCPUから処理の一部を切り離し、ストレージデバイスに移すことができる
各CSD (Computational Storage Device) は、4コアのARM A72などの独自のCPUを持ち、デバイスごとに6GBのRAMを搭載。
他のタイプのCSxは、FPGA(Field-Programmable Gate Array) をオンボードで搭載し、DBクエリのためのディープデータスキャンなど、特殊な加速機能を実行。
「汎用」のオンボードCPUも「固定機能」のFPGAアクセラレータも、どちらも重要な用途を持つ。
今後はこの2つの機能を組み合わせたCSxが増えてくる。
メインCPUをオフロードすることで、リアルタイムワークロードとデータ集約型の分析アプリケーションを同じシステム上で融合させることができる。
データの移動を減らすことで、データをストレージ上で処理することができる
24個のCSxを搭載したシステムでは、毎秒最大24GBのI/O帯域幅が追加され、システムのPCIバスに広帯域の転送を行うことなく、集中的なデータ処理が可能。
より小さなサーバーシステムに、より多くの処理能力を追加
エッジ環境で2Uのサーバーに最大24個のCPU強化用NVMe SSDを追加することで、並列処理や最大1PBのデータをまとめて処理することが可能。
このようなシステムでは、メインのx86 CPUが提供する約32GHzに加えて、ストレージ層に96GHzのARM CPU機能が追加することができ。

以下の図は、これらの要素を「従来型」のアーキテクチャと比較して示したものです。

画像3

コンピュテーショナル・ストレージ (CSx) がエッジに適している理由

データ生成量の大幅な増加に伴い、より高速でエネルギー効率の高い処理が必要となっています。
フォームファクターもより小さくなることが求められており、CSxはシステムアーキテクチャの重要な部分を占めるようになってきました。
今日のエッジシステムは膨大な量のデータを集めることができます。
しかし大規模なシステムやコンピュートクラスターの恩恵を受けることは難しく、その場で必要な分析を行うことは困難です。 

これに対してデータを中央に移動し処理するのではなく、プロセッサをデータに移動させるのです。
NGD Systemsが提供するようにストレージデバイスが生データをローカルに処理できるようにすることで、コンピュートを内蔵したCSx (SSD) は、メインCPUに移動して処理する必要のあるデータ量を減らすことができます。
アナリティクスや生データの処理をストレージ・レイヤーに押し出すことで、メインCPUは本来の重要かつリアルタイムなタスクに集中することができます。

スクリーンショット 2021-09-27 12.25.25

参考:NGD Systems Newport Platform: The World’s First NVMe Computational Storage Drive (CSD) for Scalable Compute in Storage.

CSxがどのように活用されているのか

基本的なユースケースとしては、圧縮処理をデバイスにオフロードするような単純なものなど、現在多くの場でCSxの活用を見ることができます。
特により高度なアプリケーションでの活用としては、DBや機械学習(ML)モデルなどの分析をストレージ上で実行することが挙げられます。
例えばデバイス上で完全なLinux OSを実行すれば、AI/MLやその他の高度なアプリケーションをドライブ自体で実行することができます。
VMwareでもストレージであるNVMe上でESXi ARMを直接実行するための研究開発を進めており、将来的にはNVMeデバイスだけで、これらをまたがってこうせされるvSANクラスターが実現するかもしれません。

現在、NGD Systemsと共に検討しているCSxのユースケースのひとつとして、ストレージ上で直接並列DB(Tanzu Greenplumなど)を動かすというのがあります。
メインCPUの負荷を軽減し、従来のクエリやMLの推論に基づくクエリをストレージ層上で実行することができます。
Tanzu Greenplumはノード間でデータをシャードしクロストラフィックを最小限に抑え、クエリをすべてのデータセグメントに分散させて高度な並列性能を実現することが可能です。
私たちの進捗状況については、VMworldのセッションアーカイブをご覧ください。

他にもビデオ収集や分析、IoT分析、さらには新しい自動車技術など、CSxを活用できる分野を模索しています。
CSx対応システムは小規模なオフィス、船舶、支店、宇宙の衛星などスペースが限られる場所で、従来のシステムリソースを増強し、必要なサーバの数を減らして高密度化を図り、持続可能なコンピューティングを実現します。

vSphereプラットフォームテクノロジーとモダンアプリケーションを実現するTanzuテクノロジーは、CSx対応ソリューションが提供する恩恵を最大限活用可能にします。
またVMwareは業界をリードする新しいソリューションを市場に投入するため、これらの新たな機会を模索しています。

画像5

CSxのインフラアーキテクトや消費者にとってどのような意味を持つのか

以下は、この新技術に関して最もよくある2つの質問です。

CSxはどんなサーバーにも入れることができますか?
はい、できます。
これらのデバイスは従来のストレージ・デバイスとプラグ・アンド・プレイできるよう設計されており、より容易に利用しはじめ、柔軟に導入できるように考えられています。

CSxを使用するには、アプリケーションを変更する必要がありますか?
デバイスによってはロックされた機能や固定された機能がドライブにあらかじめ搭載されているものがあります。
それぞれが単一の機能を果たし、それらを有効にするためには何らかのプログラミングが必要です。
他のデバイスでは、よりオープンでプログラム可能なリソースを持っており、単にx86からARMへのクロスコンパイルが必要な場合もありますが、アプリケーションやファンクション全体を書き換える必要はありません。

次の展開は?

CSxはまだ初期段階にあります。
しかしVMwareは、コンピュテーショナル・ストレージ(CSx)が、データが存在する場所にコンピュートを移動させることに焦点を当てたシステム設計における業界の幅広いトレンドの一部であること認識しています。
VMwareが提供するソフトウェアとこれらのハードウェアを組み合わせることで、多くの興味深いユースケースが生まれています。
既存のサーバに、より多くの能力とパワーを詰め込むことができる、エキサイティングな可能性を秘めています。
VMwareとNGD SystemsSNIAと協力しコンピュテーショナル・ストレージ(CSx)の標準化にも取り組んでいます。

以下の動画では、コンピュテーショナル・ストレージ(CSx)がどのように活用されているかをご紹介しています。

原文

この記事が気に入ったらサポートをしてみませんか?