イーロン・マスクのAI訓練特化型スパコン「道場（Dojo）」稼働開始

2023年7月25日 16:46

「道場（Dojo）」という名前は、Elon Musk氏や彼のチームがTeslaのAI訓練用のスーパーコンピューターに付けた名前です。

テスラのスーパーコンピューター「Dojo」は、大量のデータを処理し、複雑なAIや機械学習の計算を実行するために構築されています。具体的な技術仕様や詳細は公表されていませんが、Dojoはテスラ車両から収集された大量の映像やセンサーデータを処理・分析することができると期待されています。これにより、オートパイロットと完全自動運転（FSD）の改善が加速する見込みです。

「道場（Dojo）」の性能

Dojoは2024年10月までに100エクサフロップス（1秒間に実行できる浮動小数点演算の回数を100京回単位で表したもの）を達成する見込みとのことです。これは非常に高い計算能力を示しており、その性能は世界のトップ5スーパーコンピューターの1つに匹敵すると予測されています。

テスラはDojoを他社のニューラルネットワークのトレーニングサービスとして利用することに前向きな反応を示しています。これは、Dojoが特定のAIタスクだけでなく、より広範な用途にも対応できる可能性を示しています。

汎用スパコンとの違い｜富岳と比べてみると？

「富岳」と「Dojo」は、それぞれ異なる目的と設計思想に基づいて開発されたスーパーコンピュータで、その主な違いは以下の通りです：

目的：「富岳」は、多様な科学技術計算やデータ解析を行うための汎用的なスーパーコンピュータです。一方、「Dojo」は、AIの訓練、特に深層学習のモデル訓練に特化して設計されています。
アーキテクチャ：「富岳」は、富士通が開発したARMベースのCPU「A64FX」を使用しています。これは、高性能なベクトル計算機能を持つ一方で、汎用的な計算も高速に行うことができます。一方、「Dojo」は、テスラ自身が設計したAI専用のプロセッサを使用しています。これは、深層学習の訓練に必要な行列計算を高速に行うことができます。
ソフトウェア：「富岳」は、様々な科学技術計算やデータ解析のソフトウェアを動かすことができます。一方、「Dojo」は、テスラが開発したAIの訓練ソフトウェアに最適化されています。

これらの違いから、「Dojo」はAIの訓練に特化したスーパーコンピュータであり、「富岳」は汎用的な科学技術計算に適したスーパーコンピュータと言えます。そのため、それぞれが最も効率的に動作するタスクは異なります。

AI専用のプロセッサ

AI専用のプロセッサは、AIの計算タスク、特に深層学習のモデル訓練に特化した設計がされています。

深層学習のモデル訓練は、大量の行列計算を必要とします。これは、ネットワークの各層間での情報の伝播や、ネットワークの重みの更新など、学習プロセスの中心的な部分を構成しています。そのため、これらの行列計算を高速に行うことができるプロセッサは、深層学習の訓練において非常に有用です。

AI専用のプロセッサは、これらの行列計算を高速に行うための特化したハードウェア機能を持っています。例えば、テンソルコアと呼ばれる機能は、行列の乗算と加算を一つの操作で行うことができ、これにより行列計算の速度が大幅に向上します。

また、AI専用のプロセッサは、大量のメモリ帯域幅を持つことが多いです。これは、深層学習のモデル訓練では大量のデータをプロセッサとメモリ間でやり取りする必要があるためです。大量のメモリ帯域幅を持つことで、これらのデータのやり取りがスムーズに行われ、訓練の速度が向上します。

これらの特性により、AI専用のプロセッサは、深層学習のモデル訓練を高速に行うことができます。

「道場（Dojo）」はテスラが独自開発したAI専用プロセッサ搭載

イーロン・マスクが率いるTeslaが開発しているAI訓練専用スーパーコンピュータ「Dojo」の詳細なハードウェア仕様は公開されていませんが、Tesla自身が開発したカスタムAIチップを使用することが明らかにされています。

Teslaは自動運転システムのための自社製AIチップを開発しており、そのチップはTeslaの自動運転車両に搭載されています。このチップは、車両が周囲の環境を理解し、適切な行動を取るためのAIの推論を高速に行うことができます。

Dojoの開発についてイーロン・マスクが公に語った情報によれば、Dojoは「D1」と呼ばれるTesla自身が設計した新たなAIチップを使用することが明らかにされています。このD1チップは、AIの訓練に特化した設計がされており、大量の行列計算を高速に行うことができます。

したがって、DojoのAI専用プロセッサはTesla自身が開発したものを採用していると言えます。

その他のAI訓練特化型スパコン

テスラが開発している「Dojo」のように、AIの計算タスクに特化した設計がされているスーパーコンピュータは他にも存在します。以下にその一部を紹介します：

Google's TPU Pods：Googleは、Tensor Processing Unit（TPU）というAI専用のプロセッサを製造しています。これらのTPUを組み合わせたシステムを「TPU Pods」と呼び、これは大規模なAIの訓練タスクに使用されます。
NVIDIA's DGX SuperPOD：NVIDIAは、AI専用のプロセッサであるGPUを製造しています。これらのGPUを組み合わせたシステムを「DGX SuperPOD」と呼び、これも大規模なAIの訓練タスクに使用されます。

これらのシステムは、深層学習のモデル訓練や大規模なデータ解析を高速に行うことができます。また、これらのシステムは、クラウドサービスとして提供されることもあり、一般の研究者や企業が利用することができます。

NVIDIAのDGX SuperPODでAI開発を行っている企業

OpenAI：OpenAIは、自身のAIモデルの訓練にNVIDIAのDGX SuperPODを使用しています。特に、大規模な言語モデルであるGPT-3の訓練には、DGX SuperPODが活用されました。
Microsoft：Microsoftは、自社のクラウドサービスAzureでDGX SuperPODを利用しています。Azureのユーザーは、DGX SuperPODの計算能力を利用して、自身のAIモデルの訓練を行うことができます。
Lockheed Martin：防衛産業の大手企業であるLockheed Martinは、自社のAIプロジェクトにDGX SuperPODを使用しています。特に、自動化されたシステムの設計や、シミュレーションの実行にDGX SuperPODが活用されています。

富岳をAI訓練に使う事はできないのか？

富岳は、富士通が開発したARMベースのCPU「A64FX」を使用しています。このCPUは、高性能なベクトル計算機能を持つ一方で、汎用的な計算も高速に行うことができます。そのため、富岳のハードウェアとソフトウェアは、このCPUに最適化されて設計されています。

AI専用のプロセッサ（例えば、NVIDIAのGPUやGoogleのTPUなど）を富岳に追加するためには、富岳のハードウェアとソフトウェアを大幅に変更する必要があります。これには、新たなプロセッサと既存のCPUとの間でデータをやり取りするための新たなインターフェースの設計、新たなプロセッサに最適化されたソフトウェアの開発、新たなプロセッサの冷却システムの設計など、多くの課題が伴います。

したがって、既存のスーパーコンピュータに新たなプロセッサを追加することは、一般的には行われません。新たなプロセッサを使用するためには、新たなスーパーコンピュータを設計することが一般的です。

この記事が気に入ったらサポートをしてみませんか？