連載
» 2007年04月02日 17時00分 公開

元麻布春男のWatchTower:見えてきたPenrynとNehalemの「革新性」 (1/2)

インテルが45ナノCPUとして予定している「Nehalem」は「Pentium Pro」以来の変革が施される。そのキーワード“組み合わせ”はCPUに何をもたらすのだろうか。

[元麻布春男,ITmedia]

 3月29日、Intelは2007年後半から量産に入る45ナノメートルプロセスルール(45ナノプロセス)により製造される2世代分のCPU、PenrynファミリーとNehalemファミリーに関するブリーフィングを行った。45ナノプロセスとして最初に登場するPenrynファミリーは、現在、主力となっているCoreマイクロアーキテクチャに基づくもの、45ナノプロセスで2世代めとなるNehalemファミリーは、新しいマイクロアーキテクチャに基づくものとなる。すでにIntelは45ナノプロセスによるCPU15種類を開発中であることに加え、その次の世代になる32ナノプロセスによるプロセッサの開発にも着手しているという。

 2007年にデスクトップとDPサーバーのハイエンドで製品投入が始まるPenrynファミリーだが、現行のCoreマイクロアーキテクチャ同様、サーバーとデスクトップPC向けにはデュアルコアとクアッドコア、モバイル向けにはデュアルコアの製品が提供される。そのアーキテクチャは、基本的にCoreマイクロアーキテクチャを継承するとしながらも、いくつかの点において性能と消費電力削減の両面で強化が行われている。性能全般に関する強化で最も顕著な改良は、動作クロックの引き上げとキャッシュサイズの拡大である。

ブリーフィングで示された65ナノから32ナノにいたるインテルCPUのロードマップ。「既存シュリンク→新アーキテクチャ」のサイクルで開発が進むことが示されている
PenrynコアCPUに実装される機能とスペック。デスクトップ向けでは動作クロックが3GHzを超え、L2キャッシュは6Mバイト(クアッドで12Mバイト)に、モバイル向けでは省電力機能が新たに用意される

 2007年1月の発表にあったように、High-k絶縁膜と金属ゲート材料を用いるPenrynは、リーク電流を削減しながらトランジスタのスイッチング速度を改善する。これによりPenrynファミリーの動作クロックは3GHzを越えてくる。これに合わせて、ハイエンド向けのモデルでは、FSBも最大1.6GHzまで引き上げられる。

 また、トランジスタ密度の向上によりL2キャッシュも増えることになる。Penrynでは2つのコアで共有されるL2キャッシュ容量の最大値が、現在の4Mバイトから6Mバイトに増え、サーバとデスクトップPC向けに提供されるクアッドコアでは、1つのパッケージに2つのダイを内蔵するため、L2キャッシュ容量は最大で12Mバイトに達する。こうしたキャッシュ容量の拡大により、トランジスタ数はCore 2 Duoプロセッサの2億9100万個から4億1000万個(これはデュアルコアの場合で、クアッドコアでは8億2000万個)に達するが、ダイ面積は65ナノプロセスのCore 2 Duoプロセッサより25%削減された107平方ミリにとどまる。

 それ以外にも、SSE4命令の採用やSuper Shuffleエンジンによるメディア性能の強化、ATA命令の搭載、基数を16にした除算器(Radix-16 divider)による高速な除算が、アーキテクチャの強化項目として挙げられる。

 SSE4命令は従来から搭載されているSIMD命令セットであるSSEの最新版であり、50あまりの命令が追加される。Super Shuffleエンジンは、SSEの128ビット長レジスタに格納される複数のデータセットの入れ替えやシフトを高速に行うもので、SSE4命令を含むSSE命令で透過的に利用される。ATA命令の“ATA”は「Application Targeted Accelerators」の略で、データをやりとりするときのエラーチェックに用いるCRCを高速化する命令だ。SSE4命令ならびにATA命令を利用するには、これらをサポートしたコンパイラが欠かせないが、これもIntelコンパイラがサポートする。Radix-16 dividerは従来からある除算器の2倍の性能を持つとされるが、ソフトウェアからは透過なので、とくに対応を必要としない。ほかにもVT-xの拡張により、仮想環境を利用した処理におけるオーバーヘッド削減も盛り込まれる。

 一方、エネルギー効率のさらなる向上という点について、モバイルPC向けのPenrynでは、「Deep Power Down Technology」と「Enhanced Dynamic Acceleration Technology」が採用される。

 Deep Power Down Technologyは、省電力を実現する新たなパワーステートを用意するものだ。キャッシュをオフにしてしまうことで、これまで最も消費電力の低かったC4ステートの状態からさらに消費電力を削減する。Enhanced Dynamic Acceleration Technologyは、片方のコアのみが動いていてもう片方のコアがアイドル状態のとき、片方のコアがアイドルになることで余裕が生じた“TDPまでの発熱マージン”を使って動作しているコアをオーバークロックしようというものだ。発生する熱がTDPまで余裕がある場合、それを利用してオーバークロックするというアイデアは、Itanium 2で搭載される予定だったFoxtonテクノロジと似ているが、Itanium 2への実装が延期されたため、PenrynのEnhanced Dynamic Acceleration Technologyが先に実用化されることになる。

ブリーフィングの資料で示された「Deep Power Dowm Technology」は、これまでのC4状態からさらに省電力を進めた状態を実現する
同じく、ブリーフィングの資料で示された「Enhanced Dynamic Acceleration」は片方のコアをアイドルにしたときに生じる発熱マージンを利用したオーバークロック機能といえる

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

この記事が気に入ったら
ITmedia PC USER に「いいね!」しよう