次世代ハイエンドプロセッサの分析
年に一度の台北コンピュータエキスポが再び幕を閉じました!今回のタイミングにより、各大チップメーカーは大きな動きを見せました。
これから発売予定のハイエンドプロセッサについて話しましょう。
1.AMDについて
まずはAMDからです。
彼らはZen5シリーズのデスクトッププロセッサを発表し、予想よりも3ヶ月早く、今年7月に発売予定です。性能の向上はどれくらいでしょうか?Zen4と比べて、IPC性能が16%向上しました。
IPCとは、各クロックサイクルで実行される命令数のことです。クロックサイクルとはCPUの動作周波数の逆数です。実行される命令とは具体的にどんな命令でしょうか?簡単に言うと「すべての種類の命令」です。命令ごとに実行にかかる時間は大きく異なりますが、タスクが十分に多様で包括的であれば、各種プロセッサが処理する命令には大差がなくなります。
業界では、SPEC2017のようなプロのテストソフトウェアを使用するのが一般的です。これには整数演算、浮動小数点演算、メモリアクセス命令、条件分岐、分岐予測、ループ制御などが含まれています。
もしSPEC2017で前世代の製品に対してIPCが16%向上したとすれば、それは同じ動作周波数であれば、新しいプロセッサの性能が前世代よりも16%高いことを意味します。
しかし、AMDはここで少しトリックを使っています。彼らの16%の向上は、カスタムテストセットでの向上です。
簡単に言うと、AMDはすべての項目をテストした後、向上が最も大きい項目を選び出して平均を取り、その結果が16%の向上です。このテストセットにはゲームや他のプロフェッショナルなテストソフトウェアの最高項目が含まれているため、実際のIPC向上はおそらく7割程度だと予想しています。
AMDは今回、9950X、9900X、9700X、9600Xの4つのCPUを発表しました。それぞれ16コア、12コア、8コア、6コアで、後者の3つはTDPが120W、65W、65Wです。
これは現在では非常に珍しい低消費電力です。後ほどIntelの話をするときに理解できると思いますが、今日のCPU、特にバッテリー寿命を追求しないデスクトッププロセッサでは、平均消費電力が200W〜300Wが普通で、ピーク消費電力は450Wに達することもあります。主流のパフォーマンスレベルのCPUで消費電力が65Wに設定されているのを見ると、まるで165Wから「1」を消したかのように感じます。
AMDはまた、Intelのハイエンドプロセッサ14900Kとゲーム性能を比較し、4%〜23%の向上を示しています。シングルプレイヤーゲームでは10%以内の向上が一般的で、オンラインゲームでは10%以上の向上が見られます。
AMDの新しいデスクトッププロセッサの位置づけは非常に明確です。つまり、前世代よりも優れたCPU性能を提供することです。
この論理には少し問題があります。CPUの位置づけがCPU性能の向上を超える範囲に入ることがあるのでしょうか?そうです。なぜなら、今日の状況では、多くのメーカーがCPUにさまざまな機能を追加したがっています。例えば、内蔵GPUの性能を向上させる、大きなNPU(ニューラルネットワークプロセッサ)を追加してAI性能を向上させる、メモリをCPUに統合するなどです。これらの取り組みは、CPUの競争状況をさらに複雑にします。
AMDはこれらの取り組みに対して否定的です。デスクトッププロセッサの場合、CPUに内蔵されたグラフィックス機能は、グラフィックス性能を追求するのではなく、一部のユーザーがグラフィックカードを挿さずに使用できるレベルにとどまります。また、各社が追求しているNPUは、AMDのデスクトッププロセッサには統合されていません。
一部のメディアはAMDを時代遅れと批判していますが、実際にはこれが明確な戦略だと私は考えています。
最近人気のあるAI PCのコンセプトについて、現在の技術レベルでは実質よりも宣伝が先行している状況です。モデルの規模と演算力の制約から、現在の技術ではCPUの従来の性能が要求される限り、CPUに統合されたNPUは役に立たないことが多いです。NPUがリアルタイムで大きなモデルを処理できず、処理できる小さなモデルも機能が限られているためです。そのため、ユーザーが本当に大きなモデルを必要とする場合、デスクトッププロセッサの場合、一万円以上のグラフィックカードを購入することが自然です。NPUを無理に統合しようとすると、CPU性能を向上させるためのトランジスタを数十億個使うことになります。
AMDはAI計算の設計をノートブック向けのStrix Pointシリーズに組み込んでいます。このシリーズにはAIの名が付いています。Ryzen AI 9 HX300シリーズという名前です。このように長い名前をAMDが初めて使用するため、ユーザーは今後おそらくHX3XXと略して呼ぶでしょう。AIはデフォルトで省略される部分です。
HXシリーズの中で最も高性能な内蔵GPUはHX370で、その性能はデスクトップ版の内蔵GPUの8倍に達し、最も安価な独立グラフィックカードと同等の性能を持っています。今後、一部のゲーム機でも使用される可能性があります。
デスクトップ版にはないNPUがHXシリーズにはあり、性能は50TOPSです。これは以前の最高性能を持つSnapdragon X Eliteの45TOPSを上回り、同日に発表されたIntelの新CPUの性能も上回っています。
これは単なる数字上の優位性ではなく、50TOPSの演算能力はFP16の精度で処理できます。
AIの演算能力について、TOPSのTは10の12乗を、OPSは操作数を意味します。どのデータの操作数かというと、INT8形式のデータです。一般的には、INT8をFP16に変換すると演算能力が大幅に低下しますが、AMDの50TOPSにはFP16のデータも含まれています。FP16を使用することで精度が大幅に向上し、最も簡単にわかる利点は出力の精度がINT8よりもはるかに優れていることです。
2.インテルについて
次にインテルについて見てみましょう。
インテルはLunar Lake(ルナー湖)プロセッサを発表しました。2015年以降、インテルは各世代のアーキテクチャに「湖」の名前を付けています。Meteor Lake(メテオ湖)は前世代で、その前にはRaptor Lake、Alder Lake、Rocket Lake、Tiger Lake、Ice Lake、Comet Lake、Coffee Lake、Kaby Lake、そしてSkylakeがありました。
今回のLunar Lakeはモバイル向けプロセッサです。デスクトップ向けプロセッサはArrow Lakeと呼ばれ、3ヶ月後に発表される予定です。
まずモバイル向けプロセッサを発表するのは、インテルが製造プロセスで抱えている困難を反映しています。新しいバージョンのCPUは高い周波数に達しにくく、高消費電力での大幅な性能向上が難しいため、低消費電力での優位性を持つ製品を先に発表することになりました。
この難局は数世代にわたって続いています。たとえば、最近発売されたばかりのMeteor Lakeプロセッサは、前世代製品よりも性能が若干劣ることがあります。インテルは以前、各世代のプロセッサ性能が3%しか向上しないことでユーザーから「進歩が遅い」と揶揄されました。昨年はその進歩すら見られず、逆に性能が後退してしまいました。
では、Lunar Lakeも同じように性能が後退するのでしょうか?
いいえ、今回はむしろ性能が急上昇する可能性があります。前世代のMeteor Lakeと比較して、少なくともLunar Lakeの半導体プロセスは大幅に改良されています。
Meteor LakeのCPUは、Foveros 3D技術で組み合わされた4つの小さなブロックから成り立っています。最新のN3Bプロセスを使用しているのはそのうちの1つだけです。しかし、Lunar Lakeでは、大部分がN3Bプロセスを使用しており、Bluetooth、Thunderbolt、USB、PCIe、セキュリティ管理などの周辺機能だけがN6プロセスを使用しています。それ以外はすべてN3Bプロセスを採用しています。したがって、他の部分を変更しなくても、プロセスを向上させるだけで性能が大幅に向上するでしょう。
ちなみに、インテルがプロセスの大部分を台積電に委託していることも、インテル自身のプロセス技術が追いついていないことを示しています。
インテルの最大の驚きは、メモリをCPUに統合したことです。つまり、Lunar Lakeノートブックには別途メモリを搭載する必要がなく、CPUのメタルトップカバー内に16GBまたは32GBが封装されています。
Windowsプラットフォームのノートブックとしては、32GBがほぼ唯一の選択肢でしょう。かつてのノートブックメーカーは、コスト削減のために16GBを搭載し、ユーザーが追加のメモリを購入してデュアルチャンネルを構成し、帯域幅を向上させることが一般的でした。しかし、Lunar Lakeの16GBメモリを購入すると、それは固定されており、追加することはできません。
この方法の利点は省電力です。以前、16GBのメモリがフル稼働すると5Wの消費電力が必要でしたが、2枚のメモリで10Wになります。現在、同じ32GBのメモリ容量でフル稼働しても約3Wの消費電力しか必要としないため、実際の消費電力が7Wも削減されます。
コア設計において、インテルはこれまで3世代連続でほぼ同じ構成を使用し、消費電力を増やすことで性能を向上させてきました。その結果、13900Kや14900Kの後期モデルでは、出荷時のデフォルト設定で不安定な動作が見られ、BIOSの改良で消費電力を制限する必要がありました。
しかし、Lunar Lakeの設計は大幅に変更されました。
まず、大きなコアと小さなコアに分かれています。大きなコアは、サイクルごとの命令取得、デコードユニット、マイクロ命令ユニット、キャッシュとキューの深さ、実行ユニットが増加しています。また、コアのキャッシュ容量も拡大されています。しかし、このような資材の積み重ねは正常な向上に過ぎず、驚くべきことではありません。驚くべきことは、インテルが小さなコアにも非常に多くの資材を投入したことです。どの程度かというと、Lunar Lakeの小さなコアの性能は前世代の14900Kの大きなコアをわずかに上回るほどです。
以前、多くの人はインテルのプロセッサを購入し、オーバークロックする際に最初に行うことは小さなコアを無効にすることでした。そうすることで大きなコアの安定した高周波数を実現できました。小さなコアを無効にすることが無駄だと思うかもしれませんが、それはありません。なぜなら、計算力を要求するアプリケーションはすべて大きなコアで実行されるため、小さなコアがいくらあってもほとんど意味がないからです。
しかし、Lunar Lakeからは小さなコアの数を無視できません。それは性能が非常に高いためです。しかし、これにより別の問題が生じる可能性があります。これほど強力な小さなコアが、低消費電力特性を持ち続けることができるかどうかです。これらはすべて、今年秋にLunar Lakeノートブックが全面的に発売されるまで確認できません。
ノートブック向けプロセッサであるため、内蔵GPUとNPUが含まれ、性能も追求されています。インテルは今回、Lunar LakeのNPUが48TOPSであり、AMDの50TOPSよりも少し低いと宣伝していますが、プロセッサには内蔵されたディスプレイコアもあり、AI性能を提供することができます。合計で67TOPSの性能を持っています。したがって、CPUの計算力を使わなくても、内蔵GPUとNPUを合わせると115TOPSのAI計算力を持つことになります。これは非常に実用的な性能です。
なぜなら、例えば多くのプレーヤーやブラウザ内蔵のプレーヤーが、動画視聴中に解像度を向上させることができるからです。例えば、1080Pの動画を視聴している場合、ニューラルネットワークアルゴリズムを使用して4Kに補完することができます。実際の4Kと比べると若干の差がありますが、補完後の効果は1080Pよりも明らかに良くなります。このような応用はゲームにも使用できます。GPUは低解像度の画像を計算し、残りの作業をNPUに任せて高解像度に補完します。
NPUの計算力が不足している場合、このような大規模な計算タスクを処理することはできません。実現するには、CPUやGPUの計算力を借りる必要がありますが、この場合、CPUやGPUも忙しく、手助けを借りると全体の性能が低下します。映画鑑賞やゲームプレイ時、プロセッサ内蔵のディスプレイコアとNPUは大抵の場合、アイドル状態です。したがって、115TOPSの追加計算力を使用して解像度を向上させるのは最適です。
全体として、AMDのデスクトップ版CPUは既存の基盤をもとに小幅な改良を加え、モバイル版CPUは大幅に改良されました。インテルはここ5年間で最大の調整を行い、性能が大幅に向上します。
インテルの製造工場が弱いため、製造プロセスの大部分を台積電に委託しているにもかかわらず、Lunar Lakeと対応するArrow Lakeの性能と市場販売実績は良好である可能性が高いです。
特にデスクトップPCにのみ関心がある人々にとっては、AMD自身が定義するIPCの16%向上を気にする必要はありません。私を信じてください。2024年のクリスマス頃に登場するArrow LakeデスクトップCPUを待ちましょう。その性能は、AMDの最上位デスクトッププロセッサRyzen 9950Xを大幅に超えることができます。