見出し画像

RTX4090のまとめ:発売予定日、価格

NVIDIAは、9月のRTX 4090から、次世代のGeForceRTX40シリーズグラフィックスカードを今年後半に発売する予定です。AD102ダイに基づいて、このフラグシップは、126のSM、63のTPC、および11のGPCにわたってなんと16,128のFP32コアを詰め込みます。残りの1.5GPCとそれに付随するTPC/SMは、歩留まりを向上させるために無効になります。SM(Compute Unit)に関しては、NVIDIAには、世代ごとに、特にコア数とクラスターあたりのINT32:FP32コアの比率を再配置する習慣があります。この世代でどのような変更が行われるかは不明ですが、考えられるシナリオは2つあります。

画像2
パターンA

最初の可能性は、INT32とFP32のデータパスまたはクラスターの分離です。この場合、各SMは128個のFP32コアを取得し、32個のINT32は4つの個別のクラスターまたはサブコアに分割されます。整数ALUと浮動小数点ALUを分離すると、全体的なFP32スループットが向上し、ゲームのパフォーマンスが向上します。L1データキャッシュは192KBに増加し、L2は96MBにプッシュされます。

画像1
パターンB

2番目に考えられる設計は、非同期メディアアクセラレータを使用して2つを接続することにより、基本的にSM内のすべてを2倍にすることです。2倍のコア、2倍のディスパッチユニット、2倍のキャッシュチャンク、2倍のスケジューラ。少なくとも机上では。実際には、これにより、一方のSMで実行されているワープが他方のリソースにアクセスできるようになり、それによって使用率とスケーラビリティが向上します。これは、AMDがwave32形式を使用したGPUでのスケジューリングの基本単位としてWGPで2つのCUを結合した方法に似ています。

L2は、それぞれ4つのGPCで共有される2つの部分に分割されます。LLCは、Ampereのわずか6MBからLovelaceの96MBに成長しました。バス幅は、12個のコントローラー間で384ビットのままである必要があります。AD103やAD104などのローエンドSKUは、バスがスリムになり、コントローラーが少なくなる可能性があります(256ビット)。

パフォーマンスに関して言えば、GeForce RTX 4090は、RTX3090の少なくとも2倍の速度であると推測されています。このパフォーマンス目標を達成するために、450Wから600Wの間で消費が推移します。効率とRTコア数の両方の観点から、レイトレーシングのパフォーマンスが大幅に向上することを期待してください。最後に、次世代のGeForceフラッグシップの価格は、1,500ドルから2,000ドルの範囲に可能性があります。 すでに述べたように、発売は、CEOのジェンスンフアンが率いるイベント中に9月に行われます。

NVIDIA RTX 3090の仕様の概要:

  • GPUあたりx11GPC、x63 TPC(6 TPC / GPC)、x2 SM / TPC、x126SM。

  • SMあたりx128FP32CUDAコア、GPUあたりx16128FP32CUDAコア。

  • SMごとにx4第4世代テンソルコア、GPUごとにx504。

  • SMあたりx1の第3世代RTコア、GPUあたり126。

  • 96MBのL2キャッシュ。

  • x1232ビットメモリコントローラー。

  • 24GBGDDR6X21Gbpsメモリ。

  • TDP: 450-600W。

  • 価格: $1,500-2,000。

  • 予想発売日: 2022年9月。


この記事が気に入ったらサポートをしてみませんか?