パッケージ
Phenom公式サイトへ
  • AMD
  • 発表日:2007/11/19
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2007/09/11 13:00

ニュース

「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する

9月11日付けで公開されたPhenom&Phenom FXの製品ロゴ
画像集#002のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する 画像集#003のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 2007年9月10日の記事でお伝えしたとおり,AMDは開発コードネーム「Barcelona」(バルセロナ)と呼ばれていた新世代のサーバー&ワークステーション向けCPUを「Quad-Core Opteron」(クアッドコアオプテロン)として発表した。その位置づけから見れば,ゲーマーとは直接関係のない製品だが,AMDの次世代デスクトップ向けCPU「Phenom」と共通するスペックを持つ“真のクアッドコアCPU”といえば,気になる人は多いのではないだろうか? 今回は一種のPhenomプレビューとして,報道関係者向けに開催された事前説明会の内容を中心に,Quad-Core Opteronの概要を紹介していきたい。


AMDにとって2007年最大のトピックとなるBarcelona

真のクアッドコアCPUがついに市場へ


John Fruehe氏
画像集#004のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 事前説明会にはサーバー/ワークステーション製品のプロダクトマネージャーであるJohn Fruehe(ジョン・フリー)氏が来日し,開口一番,「私自身,Barcelonaにワクワクしている。業界もきっとワクワクしていることと思う。BarcelonaのリリースはAMDにとって2007年最大のトピックだ」と述べ,Barcelona=Quad-Core Opteronの普及に自信を覗かせた。

 氏の説明は,電力効率とパフォーマンス,仮想化技術のサポートが中心で,ゲームにおけるパフォーマンスという観点では興味の対象外になる部分も少なくないため,本稿では,4Gamer的に重要と思われる部分をピックアップして説明していきたいと思う。

Barcelonaの内部構成。4個のCPUコアがL3キャッシュを共有するのが大きな特徴だ。デュアルダイ仕様のクアッドコアCPUに見られるボトルネックが原理的に生じない
画像集#005のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 さて,Quad-Core Opteronの特徴は,冒頭でも述べたように,真の(ネイティブな)クアッドコアCPUであるという点だ。
 2007年9月時点で入手可能なIntelのクアッドコアCPUは,デュアルコアのCPUダイを一つのチップに載せた“デュアルダイ”構成になっている。4個のCPUコアが一つのCPUパッケージに封入されてはいるものの,実際には,二つのデュアルコアCPUダイがFSB(Front Side Bus,フロントサイドバス)を介してつながっているわけだ。

 デュアルダイ仕様のクアッドコアCPUで大きなボトルネックとなり得るのがキャッシュ周りである。ご存じの読者も多いだろうが,キャッシュはメインメモリとCPUの速度差を埋めるために用意されている高速な一時記憶メモリだ。メインメモリの内容を4個のCPUコアが共有する以上,その一部をコピーして置いておくキャッシュの内容は,4個のCPUコアから共有できるよう,同一になっていなければならない。同一でないと処理が破綻してしまうからだ。
 このとき,デュアルダイ仕様では,二つのダイそれぞれにキャッシュが用意されるため,両キャッシュの内容を同一にすべく,両ダイ間でデータをやり取りする必要がある。そのとき使われるのが,CPUコアから見ると低速なFSBなので,そこが大きなオーバーヘッドを生じさせてしまう。

 その点,Barcelona世代のCPUでは,一つのダイに4個のCPUコアが集積される。L1およびL2キャッシュはCPUコアごとに用意されているが,L3キャッシュは4個のコアから共有されるのが特徴だ。キャッシュの構成は以下のとおりである。

  • L1:CPUコアごとに64KB(データと命令が分離するハーバードアーキテクチャ型で,データ32KB,命令32KB)
  • L2:CPUコアごとに512KB
  • L3:共有2MB

 L1とL2が共有されないのは,これらが命令やデータに頻繁かつ高速にアクセスする狭い領域に対応し,L3が広い範囲を受け持つというように,役割が異なるためだ。
 キャッシュの制御には,L1/L2/L3それぞれでデータが重複しない「Victim Cache」手法が採用されている。各CPUコアはL1,L2,L3に並列アクセスが可能で,例えばL1にデータがなければL2から,L2にもなければL3から高速に取り込めるよう制御されている。このキャッシュ制御法はAthlon XP時代から採用され続けているもので,AMDはこれが最良と考えているようだ。
 いずれにせよ,4コアで共有するL3キャッシュを持つQuad-Core Opteronでは,原理的にデュアルダイ仕様で生じるボトルネックが発生し得ない。これがAMDのいう「真のクアッドコア」のポイントである。

Quad-Core Opteronではメモリコントローラの動作が最適化され,実質的なメモリ帯域幅が拡大しているという。どのように改良されているかは詳細な情報が公開されていないので不明な部分が多いのだが,スライドの左側を見ると,簡潔にポイントが示されている
画像集#006のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 ところで,Intelの一般ユーザー向け次世代CPU「Penryn」(ペンリン,開発コードネーム)世代では,L2キャッシュ容量がデュアルコアの1ダイ当たり6MBに拡大される。クアッドコアCPUを実現するにはデュアルダイ構成を採らねばならない一方,共有キャッシュ容量はQuad-Core Opteronの3倍(※クアッドコア同士の比較なら6倍)に達するが,Fruehe氏は「Barcelonaのアーキテクチャは効率が高く,キャッシュやメモリコントローラの性能が高いから,2MBで十分だ」と胸を張っていた。
 だがそんなAMDも,ロードマップを見てみれば,2008年に予定されている45nmプロセスの次世代クアッドコアCPU「Shanghai」世代でL3キャッシュを6MBに拡大する予定になっている。本当に2MBで十分なら拡大する必要はないわけで,Quad-Core OpteronでL3キャッシュが2MBになっているのは,効率の問題というよりむしろ,「65nmプロセスではダイサイズ的に2MB以上のL3キャッシュを載せるのが難しい」というのが本当のところだろう。もっとも,氏の発言に根拠がないわけではなく,メモリコントローラに大きな改良が加えられ,実質的なメモリ帯域幅は拡大しているのだが。

SSE実行周りが大幅に高速化されているのがBarcelona世代の特徴だ。従来は64bit単位で処理されていたSSE命令を,Barcelonaでは128bit幅で処理可能になった。それに合わせ,命令フェッチやデータキャッシュの帯域幅も改良されている
画像集#007のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 このほかパフォーマンスについてFruehe氏が強調したのは,浮動小数点演算,なかでもSSE命令の実行に関する改良である。
 SSE命令は128bit単位で演算できるが,従来のOpteronやAthlon 64 X2では,内部で128bitのデータを“二つ折り”にして,64bit単位で演算を行っていた。これに対してBarcelonaでは128bitの演算器が内蔵されるので,128bit単位の命令を一度に処理可能だ。これにより,大きくパフォーマンスが向上するという。
 処理単位の変更に合わせて命令やデータのスループットを向上させるため命令の取り込み(命令フェッチ)も改良され,データキャッシュの帯域幅拡大が図られているとのことである。

 SSE命令というと,動画などのエンコード/デコード専用というイメージがあるかもしれないが,最近は従来の浮動小数点演算命令に変わってSSE命令を中心に利用するソフトウェアが多くなってきている。SSE命令のパフォーマンスアップはゲームなど,さまざまなアプリケーションの性能向上につながるだろう。
 またFruehe氏は触れていないが,AMDはQuad-Core Opteronで整数演算に関しても高速化を図ったとしている。詳細は不明だが,1クロックで実行できる命令数が従来のOpteronよりも増えているようだ。

パフォーマンスの指標として示されたのは,サーバー業界標準の並列コンピューティング性能ベンチマーク「SPEComp_2001」と浮動小数点演算性能ベンチマーク「SPECfp_rate2006」など。「Quad-Core Opteron Model 2355/2.0GHz」が,よりクロックの高いIntel製サーバー/ワークステーション向けCPU「Quad-Core Xeon」より高速とアピールされている。ただし,SPEComp_2001とSPECfp_rate2006で比較対象となるXeonの動作クロックが異なる点は要注意
画像集#008のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する

Barcelonaの高い電力効率をアピールするAMD

新たな指標「ACP」とは?


 以上がパフォーマンスに関する概要だが,実のところ,Fruehe氏が最も時間を使って説明したのは,電力効率に関する部分だった。現在サーバー分野では,データセンターの膨大な電力消費が大きな問題になっており,Quad-Core Opteronの高い電力効率こそ,最もアピールしておきたいところなのだろう。
 Quad-Core Opteronでは新たな消費電力の制御が採用されている。ポイントは「Independent Dynamic Core Technology」(以下IDCT)と「CoolCore Technology」(以下CoolCore),「Dual Dynamic Power Management」(以下DDPM)の三つだ。

Quad-Core Opteronでは,4コアそれぞれ動作クロックが負荷に応じてダイナミックに変化するIDCTが採用されている
画像集#009のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 IDCTは,CPUの負荷状況に応じて動作クロックや動作電圧を動的に制御する「PowerNow! Technology」(以下PowerNow!)の拡張だ。広義にはPowerNow!の一部となるIDCTは,クアッドコアCPUが内蔵する4個のCPUコアそれぞれのステート(≒動作モード)に単独で移行できるようになっている。「あるコアだけフルパワーで動作し,残る3コアは省電力モードに移行する」ような制御が可能になったのだ。

CoolCoreの概要。スライド中のHot Spotはあくまでイメージだが,こんな感じでピンポイントで電源のオン/オフを行える。ドライバ不要で動作できる点も,AMDはウリとして強く謳う
画像集#010のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 続いてCoolCoreは,各コアにおける,使用していない回路の電源をオフにしてしまうもの。要するに「使っていない部屋の電気はこまめに消しましょう」という発想だ。
 例えば,あるコアでFPU(Floating-point number Processing Unit,浮動小数点演算装置)とL2キャッシュが使われていなければ,その二つに対する電源供給を止めてしまうといった具合。CoolCoreはCPUに内蔵されるメモリコントローラにも組み込まれており,メモリモジュールから読み出すときには書き込む側の回路を電源オフに,逆に書き込むときには読み出し側の回路の電源をオフにすることで,全体の消費電力を抑えているという。
 また,オン/オフの制御はFPUやキャッシュ,メモリコントローラといった大きなブロック単位だけではなく,AMDが「Hot Spot」(ホットスポット)と呼ぶ,高温になりがちな,面積的には狭い単位でも制御されるとのこと。
 スライドで,黒い点をいくつか確認できると思うが,これがHot Spotのイメージで,この規模での制御が可能になっているのだそうだ。

DDPMの概要を示したスライド。ちなみにこれは,かつて「Split Power Plane」と呼ばれていたものと同じ機能。マーケティング的に別の名前が与えられただけだ
画像集#011のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 CoolCoreの制御はCPU内部で行われており,外部にはまったく影響を与えないという。「特別なドライバやハードウェアは不要。BarcelonaにCPUを換装するだけで省電力の恩恵が受けられる」とFruehe氏は強調していた。

 もう一つのDDPMだが,これはCPUコアとメモリコントローラのそれぞれに独立した電源の供給回路を設けて,負荷に応じて別々の電圧を供給できる仕組みのこと。メモリコントローラも利用状況に応じて電圧が抑えられ,トータルとして省電力に寄与するという。なおDDPMは,一部のモデルには組み込まれないとされている。

Barcelonaから導入され,Phenomなどでも利用されるという新たな電力指標,ACP。TDPよりも低い値になるが,こちらのほうが実使用時の消費電力により近いという。IntelのTDPと比べて,より低いワット数であることをアピールする狙いもあると思われる
画像集#012のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 続けてFruehe氏は,Barcelona世代から,「ACP」(Average CPU Power)という,新たな消費電力指標を導入することを明らかにした。
 CPUの消費電力指標としては,長らくTDP(Thermal Design Power,熱設計消費電力)が利用されてきた。しかし,TDPはそもそもPCメーカーに向けた熱設計のための指標であり,「実際にエンドユーザーがPCを使っている最中のCPU消費電力」とはやや異なる。
 ACPは,この「実際にエンドユーザーがPCを使っている最中のCPU消費電力」を数値として示すものだ。CPUをマザーボードに取り付けて標準的なベンチマークソフトを実行し,CPU使用率が100%になった状態で計測した値を,当該CPUのACPとして公開するという。

 ACPはTDPに代わるものではないが,実使用時の計測値ゆえに「ユーザーがCPUを選ぶときにはTDPよりも役に立つ指標になる」とFruehe氏。ACPという指標はQuad-Core Opteronだけでなく,今後登場するAMD製CPUのすべてで公開されるそうなので,4Gamer読者もこのACPという単語は憶えておいたほうがいいかもしれない。
 なお,ACPを計測する詳細なレギュレーションは,追ってAMDのWebサイトに掲載されるホワイトペーパーで明らかにされる予定になっている。

「供給体制は万全」とAMD

Phenomの一刻も早い登場にも期待したい


Quad-Core Opteronには,仮想化を支援するネステッドページテーブル(仮想環境におけるメモリアドレス変換のパフォーマンスを改善する技術)が「Rapid Virtualization Indexing」として新たに盛り込まれた。仮想化のパフォーマンスが大幅に向上しているという。2009年にはI/Oパフォーマンスを引き上げる「I/O MMU」が実装される予定とか
画像集#013のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 事前説明会にはBarcelonaコア版の「Opteron Model 2350/2.0GHz」を搭載したサーバー機が持ち込まれ,「仮想マシンモニタ『Xen』上で『SuSE Linux』を動作させ,さらに『VMWare』上で『Windows 2003 Server』を動作させる」というデモが行われた。
 LinuxやWindows 2003 Server上で何かアプリケーションを実行したわけではなく,少々拍子抜けするものではあったのだが,昨今のサーバー向けCPUではアピールしたいポイントだろう。まあ,このあたりはさすがにゲーマーと直接関係するところではないが。


 9月10日の記事でお伝えしたように,Quad-Core Opteronは65nm SOIプロセスで製造され,トランジスタ数は4億6300万。従来のOpteronと同じく,Socket Fに対応する。Quad-Core Opteronの立ち上げ後,独ドレスデンにあるFab 36は全面的に65nmプロセスに切り替えられるとのことで,「供給体制は万全」とFruehe氏は胸を張る。

HE High Performanceラインのニーズは全体の6%程度で,現状のラインナップでも市場の94%をカバーできるとAMDは分析する
画像集#014のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 以上,Barcelona(コアの新しいOpteron)について紹介してきたが,重要なことは,基本的なスペックが,このBarcelonaとPhenomでほぼ同じであることだ。
 Quad-Core Opteronでクロック当たりのパフォーマンスが高くなる以上,Phenomに関しても期待できそうだが,懸念材料としては,動作クロックが指摘できよう。
 下に示したのはAMDによる現時点での製品ラインナップで,立ち上げ時には標準的なモデル「Standard Performance」と高電力効率に特化した「HE Energy Efficient」の2ラインが用意され,動作クロック2.3GHz以上の「SE High Performance」ラインは2007年第4四半期の立ち上げとなっている。

Barcelona立ち上げ時のラインナップ。価格情報も含まれているので,興味のある人は参考にしてほしい
画像集#015のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する

事前説明会では,今後のサーバー/ワークステーション向けCPUのロードマップも示された。2007年末にはSocket AM2対応の「Budapest」,2008年には45nmプロセスを用いた「Shanghai」が予定されている(※CPU名はいずれも開発コードネーム)。従来からとくに変化はない
画像集#016のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 CPUの性能は,動作クロックだけで決まるわけではない。しかし,Phenomの戦う相手が,Core Microarchitecture(Coreマイクロアーキテクチャ)をベースに高クロック化する「Penryn」世代のデスクトップ向けクアッドコアCPU「Yorkfield」(ヨークフィールド,開発コードネーム)やデュアルコアCPU「Wolfdale」(ウルフデール,同)であることを考えると,上のスライドにあった「年内に2.3〜2.5GHz」というクロック引き上げのペースで,果たして大丈夫なのかという気もする。
 Barcelona,ひいてはPhenomが動作クロックを思うように上げられなければ,せっかく真のクアッドコアCPUで,クロック当たりの性能が高くても,絶対的な動作クロックの違いで優位性を覆されるのではという懸念が拭いきれないのだ。

9月11日に開催された国内発表会では,AMDのPhil Hester(フィル・へスター)上級副社長兼最高技術責任者が登壇し,Quad-Core Opteronのウェハを公開した。「(Quad-Core Opteronは)データセンターのためのCPU」とアピール
画像集#017のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
 というわけで,未だPhenomの動作クロックが明らかになっていないこともあり,どうしても不安は残ってしまうが,それでもAMDが強調する「真のクアッドコア」がリリースされる意義は限りなく大きい。ゲームのマルチスレッド化も進んでいることを考えると,クアッドコアに最適化されたゲームにおいて,AMDが久しぶりにIntelからパフォーマンスリーダーの地位を奪い返す可能性は十分にあるはずだ。両社の次世代デスクトップPC向けCPUが出揃うタイミングを,楽しみに待つこととしよう。

この2カットも9月11日の発表会から。左は,PhenomやPhenom FXは,AMD 690もしくはAMD 7xxチップセットと組み合わされることを示したスライド。右は2009年の次世代プラットフォームについて言及したスライドだ
画像集#018のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する 画像集#019のサムネイル/「Quad-Core Opteron」の概要から来たるべき「Phenom」を推測する
  • 関連タイトル:

    Phenom

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
スペシャルコンテンツ
注目記事ランキング
集計:11月13日〜11月14日