クライアントPCのストレージがSSDに移行して久しい。今では最新のPCIe 4.0対応のSSDが登場し、ベンチマークテストでは派手なスコアが飛び交って話題を集めているが、実際に一ユーザーとして使う場合、大切なのは実利用環境でのパフォーマンスだ。インテル最新のクライアントPC向けSSD「インテル SSD 670p」を使って、そのあたりの実情を確かめよう。
PCの要となるCPUにおいて不動のNo.1ブランドであるインテルは、SSDでもメジャーの一角を占めるトップブランドだ。半導体技術に加えて、クライアントPCからデータセンターまで、ノウハウを生かした信頼性の高さが支持されている。
SSD(Solid State Drive)は、不揮発性メモリ(通電していなくともデータを保持できるメモリ)を記録媒体とするストレージだ。主にNANDフラッシュメモリが使われる。
データを磁気で記録し、読み書きの際に機械動作(モーターで部品が動く)を伴うHDDと違い、SSDのデータの読み書きは電気的な操作のみで完結するため、アクセスタイムが高速でレスポンスに優れる上に、並列アクセスなどで帯域の高速化もしやすい。さらに静音で省電力、振動や衝撃にも強いと、ストレージとしてのメリットが大きい。課題であった大容量化(記録密度向上)、容量単価(容量あたりのコスト低下)もテクノロジーの進化により、年々改善されている。
そのテクノロジーの部分で業界をリードしてきたのが、他ならぬインテルだ。メモリセル1つあたりに記録するデータを増やす「多値化」、メモリセルの積層数を増やす「多層化」を推進し、信頼性を担保しつつ、データの記録密度を高めてきた。
2021年には、クライアントPCからサーバ、データセンターまで、各分野/用途における大容量化/低コスト化ニーズに応えるべく、144層のTLC、およびQLC NANDフラッシュメモリを採用した4種類のSSDを市場に投入している。
今回取り上げるインテル® SSD 670pは、最新の144層のQLC NANDフラッシュメモリを搭載したクライアントPC向けのSSDだ。
64層QLC NANDフラッシュメモリを搭載している先代のIntel SSD 660pに比べて、シーケンシャルリード/シーケンシャルライト性能が大幅に向上するとともに、耐久性の指標であるTBW(Total Byte Written)が、512GBあたり100TBから185TBにアップ。5年の長期保証と合わせた長く安心して使うことができる。
また、ファームウェアの改良でSLCキャッシュを強化(実質キャッシュ容量アップ)するとともに、SLCキャッシュ領域外の性能も高めている。これはNANDフラッシュメモリ自体の性能強化によるところが大きい。
性能と耐久性で旧世代から大幅な強化を果たしたインテル® SSD 670pだが、それでもそのスペックを見ると「地味ではないか」と思うことがあるかもしれない。
確かに最近では、PCI Express 4.0 x4インタフェースに対応し、毎秒5000MB、さらには毎秒7000MBといった派手なシーケンシャルリード性能をうたう製品が出てきており、それらに比べると、インテル® SSD 670pの表面上のスペックは地味に見える。
しかし、公開されているスペックはあくまでも最大値だ。性能が最大に出る条件の上でたたき出したもので、必ずしも実運用における速さの目安として有効とは限らない。
その最たるものが「Queue Depth(QD=キューデプス)」の条件だろう。SSDのスペックとして公開されているパフォーマンスの数値は、ほとんどがQD32の環境で計測されたものをベースにしている。ベンチマークで良いスコアを出しやすく、速く見せるのに都合が良いためだ。
しかし、クライアントPCにおいて、QD32という状況はほとんどない……いや、全くないといっていいほどである。インテルの調査によれば、実際のアプリケーションでの処理内容は、圧倒的にランダムアクセス多く、しかも大半がQD1を中心とした低QD環境であり、実に約90%はQD1〜QD2で占める。そして、リード70%、ライト30%の割合で混在する内容が多いという。
インテル® SSD 670pや先代のIntel 660pは、ベンチマークテストで良いスコアを出すためではなく、実際のアプリケーションでの実効性能を高めることにフォーカスを定めて開発されており、シーケンシャルよりもランダム、QD32よりもQD1重視、そして、リード/ライト混在環境でも性能を発揮できるようにチューニングされているという。
最近は、PCI Express 4.0 x4に対応したSSDも増えている。PCI Express 4.0は、文字通りPCI Expressの4世代目の規格で、3世代目のPCI Express 3.0に対し、1レーンあたり2倍のデータ転送速度を持つ。
SSDで使われる4レーンのPCI Express x4であれば、PCI Express 3.0なら毎秒3.94GBに対し、PCI Express 4.0 x4ならば、毎秒7.88GBにも上る。
そして、SSDのシーケンシャル性能(連続したデータの転送性能)は並列アクセスを駆使することで高めることが可能だ。レイテンシやコスト、電力を無視すれば、実質青天井に上げられるため、PCI Express 3.0 x4の理論値を大きく超えるベンチマークスコアを出すSSDも実際にある。
しかし、前述したように、クライアントPCのワークロードのほとんどはシーケンシャルアクセスではなくランダムであり、QD1〜QD2の環境となる。ベンチマークテストが出すQD8やQD32のシーケンシャル性能が有効な状況はごく限定的だ。
さらにいえば、PCI Express 4.0 x4対応SSDの単価はまだまだ高い。そして、PCI Express 4.0 x4の実力をフルに発揮するためには、高コストな環境整備も必要になり、この整備もかなりハードルが高い。
具体的にPCI Express 4.0 x4のSSDの実力を発揮するためには、SSDだけでなく、CPUやマザーボード(チップセット)、M.2ソケット全てがPCI Express 4.0 x4に対応している必要がある。インテルであれば、最新のインテル® 第11世代Core™ プロセッサとIntel Z590チップセット搭載マザーボードの組み合わせが代表的であるが、Intel Z590マザーボードのM.2ソケットもPCI Express 4.0用とPCI Express 3.0用が区別されており、前者は原則1基のみだ。AMDのRyzenシステムでも、GPU機能を内蔵したRyzen GシリーズはPCI Express 4.0非対応で、CPUに最新のRyzen 5000シリーズを利用した場合もB550チップセットではCPUにかかわらずPCI Express 4.0対応M.2ソケットは最大1基に限られる。
シーケンシャルの性能を最も実感できるのは、ファイルコピーなどだろう。しかし、送信側がPCI Express 4.0対応でも受信側がPCI Express 3.0(あるいはその逆)であれば効果は半減だ。さらにいえば、PCI Express 4.0 x4対応のSSDやチップセットは発熱も高く、十分な冷却を行うことも条件になる。
SSD自体の単価も高価であり、「コストなどの条件を度外視しても究極の速さを求める」場合を除けば、PCI Express 4.0 x4対応にこだわるのは、コスト効率、性能効率ともに良い選択とはいえないのが現状だ。
QD(Queue Depth)とは、一度に発行できるコマンドの数だ。ストレージコントローラーはキューと呼ばれる待ち行列バッファにコマンドをため、まとめて発行できるようになっている。NANDフラッシュメモリの特性上、ある程度たくさんのコマンドを一度に受け取れた方が、並列処理や実行順序の変更によるレイテンシ低減など最適化を行う余地が大きく、高速化しやすくなる。
つまり、QD1はクライアントPC環境でさまざまな処理を日常的に行うものが得意で、それに対しQD32は1つの処理をまとめて処理するもので、クライアントPCではあまりお目にかからない特殊な場合だ。
上記を分かりやすくするために料理シーンに例えると、QD1は多彩なメニューを調理するレストランであり、QD32は同じメニューをまとめて大量に作る給食に該当する。実世界で食事をするのはレストランの場合が多く、給食を食べる機会は特定の時期と環境下に置かれた場合に限られる。
あくまで処理内容の違いであって、優劣(レストランがおいしいなど)ではない点に注意してほしいが、通常のクライアントPCではレストランのような利用シーンが大半であり、給食のようなシーンはデータサーバなど特殊な利用環境に限定されるのが現実だ。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:インテル株式会社
アイティメディア営業企画/制作:ITmedia PC USER 編集部/掲載内容有効期限:2021年9月19日