見出し画像

AI時代の幕開け:Windows 12とAI PCの未来

2023年にAIが突然台頭してから、すべての企業は自社の製品をAIと結びつけたいと考えています。長い間沈黙していたPCとノートパソコンも同様です。実際、それらはAIに非常に近いです。7年前から、PCコンポーネントの中には、AI計算専用のユニットを設計したデバイスがあったからです。


AIの台頭とPCの変革

当時、それらは命令セットの形式や、CPUやGPUの中の加速モジュールの形で存在していました。例えば、2019年に発売された第10世代のCore i9-10980XEには、16ビットの「DL BOOST」命令が導入されました。第9世代のCoreと比較して、深層学習やAIアプリケーションを処理する際、同じ周波数、同じコア数の場合、理論的には計算効率が2倍になります。ただし、2019年にはこの命令セットを使用するアプリケーションはほとんどありませんでした。

グラフィックカード方面では、CUDAプラットフォームの発展の恩恵を受けているため、2017年には消費者向けグラフィックカード市場、つまりゲームをプレイするためのグラフィックカードにTensor Coreが内蔵されていました。当時のグラフィックカードはTITAN Vと呼ばれ、非常に高価でしたが、30T FLOPSのAI演算能力を提供することができました。

実際、これらの大量の行列乗算を最適化できるハードウェア施設は、2023年にAIが台頭するまで、十分に活用されることはありませんでした。

Windows 12の要求とCPUの現状

そして、2024年秋にリリース予定のオペレーティングシステムWindows 12のニュースが流れてきました。それをインストールするには、それと組み合わせるプロセッサが独立したAI処理ユニット、つまりNPU(ニューラル処理ユニット)を持っていることが要求され、処理能力は40T FLOPS以上でなければなりません。

独立したNPUユニットを持っているというこの1つの条件だけで、2024年以前にリリースされたほとんどのCPUを締め出すことができます。

例えば、現在でもCPUパフォーマンスでトップのインテルの14900Kには、NPUがありません。AMDの現在のRyzen 7000シリーズも、後に3Dキャッシュ版のRyzen 7950が追加されましたが、それでもNPUはありません。

現在、内蔵NPUを搭載しているCPUシリーズは3つしかありません。1つはAMDのXDNAアーキテクチャを内蔵したプロセッサで、2023年にリリースされたものは10T FLOPSしかなく、2024年のものでも16T FLOPSにしか向上しません。もう1つはインテル側のCore Ultraシリーズで、内蔵NPUの演算能力はわずか11T FLOPSです。そして、2024年にNPU演算能力が40T FLOPSを超えるものは、Qualcomm Snapdragon X Eliteというプロセッサだけです。

しかし、インテルとAMDは宣伝の際、できるだけ高く報告しようとしています。例えば、インテルはNPUユニットの演算能力がわずか11T FLOPSであることを単独で言及することはほとんどありません。Core Ultraは34T FLOPSのAI演算能力を持っていると常に言っています。実際、そのうちの11TはNPUから、18Tはオンボードグラフィックスから、5TはCPUから来ており、3つの部分を合わせて34Tになります。つまり、このCPUの中で呼び出し可能なリソースをすべてフル稼働させてAIタスクを計算する場合にのみ、演算能力は34Tになるのです。

一方、AMDは常に自社のRyzen 7 8845Hが38T FLOPSのAI演算能力を持っていると宣伝しています。16Tから38Tへの突然の向上も、NPU+GPU+CPUの組み合わせによるものです。しかし、これら2社のプロセッサメーカーの最新製品は、すべてのリソースを投入しても、噂されているWindows 12の最低要件である40T FLOPSには達していません。

なぜこのような状況になっているのでしょうか。主な理由は、2024年に発売されるCPUのアーキテクチャが2021年から2022年に決定されたためです。2022年の時点では、AIの発展がこれほど急激になるとは誰も予想していませんでした。そして、すでに老朽化し、更新の意欲を失っていたWindowsオペレーティングシステムが、AIの大波の中で突然飛躍し、参入基準を非常に高くしたのです。

オペレーティングシステムが先走った理由もあります。マイクロソフトは、今回のAIの急速な発展の最大の推進者だったのです。OpenAIの初期の1300億ドルの演算能力のサポートと、その後4年間で総額1兆ドルのスーパーデータセンターの構築は、すべてマイクロソフトが背後にいる資金提供者でした。Windowsはマイクロソフトの最も重要な製品であり、AI分野で遅れを取るわけにはいかないのです。

さて、AIの機能は実際にPCの中で何ができるのでしょうか。

今日すでに登場しているアプリケーションには以下のようなものがあります。

ビデオ会議ソフトウェアでは、さまざまな会議の背景を自動的に生成する機能があります。例えば、自宅で仕事をしている場合、このソフトウェアを開くと、自分をスタジオ、書斎、図書館に置くことができます。他の参加者があなたとビデオ会議をする際、あなたを見ると非常にプロフェッショナルだと感じるでしょう。

また、最新のPhotoshop 2024には、「生成的塗りつぶし」と「ニューラルネットワークフィルター」という2つの機能が搭載されています。例えば、ドローンで撮影したバスケットボールの試合の写真があり、解像度が1920×1080だとします。新しいPhotoshopでは、この画像をAIで拡張することができます。例えば、1920×2160に拡張すると、拡張された部分に何が表示されるのでしょうか。それはAIが元の画像から独自に作成するのです。

ニューラルフィルター機能はさらに豊富です。例えば、人物の表情や顔の向きの調整、古い写真の自動修復や色付けなどです。また、ビデオ再生ソフトウェアの中には、オリジナルの画質が1920×1080でも、3840×2160(4K)の解像度にリアルタイムで向上させることができるものもあります。元々なかったピクセル情報は、AIが自動的に補完することで、画質を大幅に向上させることができるのです。

マイクロソフトはAIに多額の投資をしており、Windowsでは当然のことながら、満足することはありません。マイクロソフトは、次期バージョンのキーボードにCopilotの物理キーを設計しました。

しかし、これらの機能がいかに豊富であっても、これらのAIアプリケーションとそれに付随するハードウェアはすべて過渡期のものであることを覚えておいてください。理由は簡単で、現在のNPUやメモリの容量では、大規模モデルをローカルで実行することができないからです。そのため、推論の部分はクラウドに移行されるか、GPUに移行されています。

真のAI PCはこの形ではありません。真のAI PCは、いくつかの世代の製品を経なければ実現できません。そして、現在のAIアプリケーションは、CPUが十分なNPU演算能力を持つことを強制的に要求するものではありません。

この記事の冒頭で挙げた7年前の例に戻りましょう。

2017年、NVIDIAはゲーム市場向けにTITAN Vグラフィックカードを発売しました。このカードの演算能力はどのくらいだったのでしょうか。30T FLOPSです。Windows 12の40T FLOPSの要件を覚えているでしょう。7年前のグラフィックカードのAI演算能力は、すでに非常に大きかったことがわかります。そして、実際の状況は想像以上に大きいのです。なぜなら、今日のすべてのメーカーは、自社のプロセッサのAI演算能力を説明する際に、8ビット整数のデータ形式、つまりINT8を使用しているからです。

一方、7年前のTITAN Vの30Tの演算能力は、FP16データ形式でのものでした。INT8形式に変換すると、さらに2倍になり、60Tになります。今日の最新モデルのグラフィックカード、最強のRTX 4090でINT8データを実行すると、AI演算能力は約660T FLOPSに相当します。これは、40Tの最低要件の16倍以上であり、Windows 12を十分にサポートできます。

では、なぜWindows 12はNPUに40T FLOPSのAI演算能力を要求するのでしょうか。その理由は、この演算能力がCPUやGPUの作業性能を侵害してはならないからです。

AIアプリケーションの現状と将来

今日のAIアプリケーションはまだ非常に単純で、日常の使用とシームレスに統合されていません。AIアプリケーションはすべてタスクブロックの形式で配信されています。

例えば、写真を編集して笑顔を泣き顔に変えたり、ビデオを超解像度化したり、AIで作成した音楽を生成したりする場合、指示やメニューを選択し、マウスをクリックして生成します。この時、CPUでもGPUでもNPUでも、どれが処理しても体感的には同じで、数秒から数分待つだけです。

そして、今日のこれらのタスクの大部分は、クラウドサーバー上で実行されています。例えば、OpenAIがChatGPTを実行する際、毎日20億人のユーザーの質問に答えるだけで50万kWhの電力を消費しており、あなたのCPU、GPU、NPUで計算された結果は全くありません。

しかし、将来のAIアプリケーションが成熟すれば、それはあなたの手元で常にあなたのために物事を整理してくれる秘書のようなものになるでしょう。あなたがタスクを割り当てていない時でも、それは考え、整理し、観察しています。

それは何を整理するのでしょうか。例えば、操作したファイルの内容を要約したり、画面に表示された画像を認識したり、環境内の音声を理解したりします。これらのことを行う際、すべてのデータの入力と出力にあなたの手を借りる必要はなく、バックグラウンドで自動的に完了することができます。あなたがコンピュータを使用する際、今日とほとんど変わりはなく、手動でファイルをクラウドサーバーにアップロードする必要もありません。ゲーム内でも、このNPUはCPUから特定のタスクを受け取り、適切なタイミングであなた専用のNPCキャラクターを生成します。このキャラクターは、ゲーム内であなたが操作するキャラクターと対話します。

コンピュータの電源を入れている限り、AIアプリケーションは常に動作しています。ふと思い立ったときに、例えば「小愛、先月の請求書をダウンロードして、オフィスと非オフィスに分類し、この2つのカテゴリーの請求書の合計金額を集計してください」と言うだけで、次の10数秒でAIがこれらの面倒な操作を完了してくれます。

この時のAIアプリケーションはタスクブロックではありません。かなり大きな演算能力を常に占有し、バックグラウンドで常に実行されているため、コンピュータ内の元のCPUとGPUにこのタスクを担当させることはできません。まず、一度引き受けると、CPUとGPUは他のことができなくなります。次に、これらのデバイスがAIのタスクを行う場合、エネルギー効率が非常に低く、NPUの効率には遠く及びません。

一般的に、Windowsオペレーティングシステムが提供する最小仕様の8〜16倍を満たすと、かなり良好な使用体験が得られます。例えば、Windows 11のメモリ容量の最小要件は4GBですが、今日の実際の使用では、32GB〜64GBのメモリ容量で十分に対応できます。一方、Windows 12の最小要件は、メモリ16GB + NPU 40T FLOPSです。つまり、将来Windows 12が普及した後、128GB〜256GBのメモリ容量とNPU演算能力が320T〜640TFLOPSに達すれば、Windows 12は十分に対応できるようになります。

このメモリ容量とこの規模の演算能力は、数千億のパラメータ規模の大規模モデルをローカルで実行するための条件にちょうど対応しています。

AI PCの成熟の指標

したがって、AI PCが成熟した最も重要な指標は、大規模モデルが一般的にローカル化され、NPUで実行され、GPUの助けを借りて演算能力を担う必要がないことです。

数千億のパラメータ規模の大規模モデルをローカルで実行するには、このNPU演算能力は今日のRTX 4090グラフィックカード1枚にちょうど対応しています。しかし、このカードの消費電力は450ワットと非常に高くなっています。CPU内の他のユニットの消費電力を考慮せず、NPU部分だけで450ワットもあるとすると、このCPUの消費電力は信じられないほどになります。このCPUの熱出力密度は、SpaceX Raptor 2エンジンの内壁に匹敵します。

今後数年間で、NPU部分の演算能力はさらに大幅に向上し、NPUはその時点で推論のみを担当し、計算タイプはGPUよりもさらに単一になるため、NPUはFPGAのような構造をCPU内部に設計することができ、消費電力を95%以上削減することができます。

FPGAの利点は、各論理ユニットの機能が露光装置に入る時点ですでに固定されているため、実行時に命令を必要としないことです。GPUの計算方式よりも効率的です。

GPUの計算方式は、単一命令多データストリーム(SIMD)と呼ばれ、最高司令官が突撃命令を出すと、1万人の兵士が突撃するようなものです。突撃は兵士一人一人に個別に動員する必要はありません。個別に動員するような方式は、実際にはCPUに近いものです。一方、FPGAで設計されたものは、突撃のみを行う機械戦闘員のようなもので、突撃は彼らにとって動員する必要もなく、スイッチを入れるだけで突撃するのです。

FPGAの演算効率は、GPUよりも10倍以上高くなります。しかし、欠点も明らかで、FPGA内の各論理ユニットは他のタイプの演算をほとんど実行できないことです。ただし、大規模モデルが変更されない限り、FPGAの論理ユニットも調整する必要はありません。

したがって、AI PCが成熟したもう1つの重要な指標は、CPU内のNPUがローカルで推論演算をより効率的に実行し、約1ワットで10T FLOPSの効率でAIアプリケーションに演算能力を提供することです。そのため、次世代の新しいプロセッサはおろか、次の2世代のプロセッサでさえ、このような大きな変革ができるかどうかは非常に不確実なことです。

過渡期のAI PCとWindows 12の妥協


2024年後半に大ブレイクするであろうAI PCは、実際には概念だけを売っているのです。AIアプリケーションはどれも十分に魅力的ですが、そのほとんどはクラウドサーバーが結果を提供しています。ローカルモデルが提供する推論でさえ、GPUで代替できるものばかりです。今年の秋にリリースされるWindows 12は、以前に噂されていた16GBのメモリの最小容量と40T FLOPSのNPU演算能力を大幅に妥協し、削減すると思われます。今後数年間はAI PCの過渡期だからです。


この記事が気に入ったらサポートをしてみませんか?