Nehalem、正式発表──「Core i7」の機能と導入メリットを考える元麻布春男のWatchTower(1/2 ページ)

» 2008年11月18日 11時00分 公開
[元麻布春男,ITmedia]

45ナノの“Tock”がようやく解禁

 日本時間の11月18日、インテルは最初のNehalemファミリのCPUとして、ハイエンドデスクトップPC向けのCore i7を正式に発表した。45ナノメートルプロセスルールへの微細化と、リーク電流の大幅な削減を実現するHigh-k/メタルゲート技術の採用が主な特徴であったPenryn世代のCPUに対し、第2世代の45ナノプロセスルールCPUであるNehalemは、マイクロアーキテクチャの刷新を目的とする。インテルの「Tick-Tock」戦略でいう“Tock”のモデルということになる。

 Nehalemにおいてインテルは、CPUコアと非コア(Uncore)の両面においてマイクロアーキテクチャの更新を行っている。が、最も大きく変わったのはUncoreの部分だ。Nehalem世代のCPUは、メモリコントローラを内蔵し、従来の外部インタフェースであったFSBを廃止した。これによりNehalem世代のCPUは、プラットフォームレベルで従来のCPUとの互換性を失う。具体的には、CPUソケットが変わると同時に、組み合わせるチップセットも新しいものが必要になる。

 さらに今回登場するNehalem世代CPUの上位モデルについては、コア間で共有される3次キャッシュメモリが追加される。従来のPenryn世代では、32Kバイト+32Kバイトの1次キャッシュメモリに1〜6Mバイト程度の共有2次キャッシュメモリを備えるCPUが一般的だった。Nehalemでは32Kバイト+32Kバイトの1次キャッシュメモリにコアごとに独立した256Kバイトの2次キャッシュメモリに加え、最大8Mバイトの共有3次キャッシュメモリが加わる。ほかにも電力管理機能の強化も図られており、電力効率の改善を図っている。

 CPUコアは従来のCoreマイクロアーキテクチャ(Penryn世代)を引き継いだものだが、まったく同じというわけではない。最も大きな違いはHyper-Threading技術の復活で、これによりソフトウェアに対し物理コア数の2倍となる論理コアを提供することになる。インテルはNehalem世代の物理コア数について、1〜8コアとしているので、Hyper-Threadingと組み合わせることで2〜16スレッドを同時に処理することが可能だ。ほかにもSSE4.2をはじめとする新命令セットの搭載、実効ユニットの追加、2ndレベルTLBの追加など、細かな改良が加えられている。

2008年に登場する第1世代Nehalemの基本デザイン。3チャネルのDDR3インタフェースを搭載し、Intel X58 Expressチップセットで接続される
従来のバス共有型アーキテクチャとは異なり、QuickPath Interconnect(QPI)によるポイント・ツー・ポイント接続が基本となる。これはサーバからノートPCに至るすべてのプラットフォームで共通だ。コアの数が増えるとQPIのリンク数が増える点に注意しておきたい

QPIに共有3次キャッシュに3チャネルメモリバス。最高クロックは3.2GHz

 今回発表されたCore i7は、Nehalem世代のCPUとして、これまで「Bloomfield」の開発コード名で知られてきたものだ。インテルのクライアントPC向けCPUとしては、初めて1つのダイ上に4つのコアを集積した、ネイティブクアッドコアのCPUとなる。Hyper-Threading技術を有効にすることで、8スレッドの処理が可能だ。

 Bloomfieldは上述した8Mバイトの共有3次キャッシュメモリを備えるが、ネイティブ化したことですべてのコアで共有されるキャッシュが誕生したことになる。従来のクアッドコアプロセッサは、1つのパッケージにデュアルコアのダイを2枚封入した構成であったため、異なるダイのキャッシュメモリをFSB経由でスヌーピングする必要が生じた。すべてのコアでキャッシュを共有するBloomfieldでは、ユニプロセッサのプラットフォームであることもあって、そうしたアクセスは生じない。

 Core i7シリーズの第一弾として発表されたのは、「Core i7-965 Extreme Edition」、「Core i7-940」、「Core i7-920」の3モデルになる。動作クロックは順に、3.2GHz、2.93GHz、2.66GHz。サポートとする機能はほとんど変わらないが、従来通りExtreme Editionのみリミッター(Overspeed Protection)が外されている。性能は、上述した新命令をソフトウェアがサポートしているかどうかにより大きく変わるが、同一クロック品の比較であれば、Core i7はCore 2 Extremeより5〜10%以上高速化する見込みだ(新命令セットが有効であれば、性能は飛躍的に向上する)。

 Bloomfieldが内蔵するメモリコントローラは、DDR3-800およびDDR3-1066メモリに対応する。Bloomfieldは、Nehalem世代のクライアントPC向けCPUとして、DPサーバ向けの「Nehalem-EP」とほぼ同等の構成をとるが、メモリのサポートがアンバッファタイプのDIMM専用になることが大きな違いだ。

 サポートするメモリチャネルは3本で、1つのチャネルで最大2本のDIMMをインストールできる。これまでは2本単位で購入していたDIMMを、Core i7では3本単位で購入することになる。最大メモリ容量は、最大6本のDIMMソケットに4GバイトのDIMMを装着した場合には24Gバイトとなるが、マザーボードによってはこの構成をサポートしていないので注意が必要だ。

 Bloomfieldは外部インタフェースに、シリアルバス技術であるQPIを採用する。上りと下りでそれぞれ20組の信号線(データ×16、プロトコル×2、CRC×2)で構成されるQPIは、従来のFSBと同等のレーテンシを維持したうえで、帯域が大幅に向上する。6.4GT/秒(Giga Transaction/秒)をサポートするCore i7-965の場合、帯域は25.6Gバイト/秒にも及ぶ(Core i7-940とCore i7-920は4.8GT/秒)。従来、最も高いFSB(1600MHz)を持ったCore 2 Extreme QX9770でも、その帯域は12.8Gバイト/秒であった。

コアを休めてクロックを上げる

 気になる消費電力は3種類ともTDPが130ワット、アイドル時が12ワット。Penryn世代のハイエンドであるQX9770は、Core i7-965と同じ3.2GHz動作でTDP136ワット、アイドル時16ワットだったことを思うと、トータルで若干減少している計算になる。が、実際にはPenryn世代にはなかったメモリコントローラを内蔵したことを考えれば、実質的な消費電力はもう少し減っていると考えられる。

 Nehalemの省電力機能として特筆されるのは、「Integrated Power Gate」と電源管理ユニット(専用の電源管理用マイクロコントローラ)の搭載だ。Integrated Power Gateは使われていないコアの電源を遮断することで、アイドル時のコア消費電力をほぼゼロにする。従来はクロック信号を落とすことでスイッチング電力を削減していたが、リーク電流までなくすことはできなかった。Integrated Power Gateではリーク電流もほぼゼロになる。アイドル時の消費電力が25%(4ワット)下がっている理由の1つは、このIntegrated Power Gateが影響していると考えられる。

 さらにNehalemのダイには専用のコントローラが電源管理用に搭載される。各コアの動作クロック、温度、電圧をリアルタイムで監視し、最適な状態に保つ。コントロール用のソフトウェアはファームウェアとしてCPUに内蔵されており、外部のソフトウェアなどを必要としない。

 こうした省電力機能を、逆に性能強化にあてようというのが「Intel Turbo Boost Technology」だ。アイドルになって電力を消費しないコアがある場合、それにより生じた熱設計上の余裕を利用してアクティブなコアの動作クロックを引き上げる。モバイル向けのPenrynにも採用されていたが、Nehalemでは2ステップ分引き上げることができるよう強化された。大半のゲームなど、あまりスレッド化が進んでおらず、なおかつ、動作クロックが性能に大きく影響するアプリケーションの実行を高速化する技術だ。

アイドル状態にあるコアの電力をアクティブなコアに集めて高速動作させるのがTurbo Modeの仕掛けとなる。複数のコアを休止させて、1つのコアだけのパフォーマンスをさらに高めることも可能とされている
この機能はすでにモバイル向けのPenryn世代Core 2シリーズに実装されていたが、Nehalemではさらにもう1ステップのクロック引き上げが可能になる

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年10月11日 更新
最新トピックスPR

過去記事カレンダー