分散ストレージでのアクセス集中を平準化する新技術、富士通研が開発

分散ストレージで人気データへのアクセス集中を自動的に解消し、アクセス時間の悪化を抑える技術を富士通研究所が開発した。

» 2012年07月30日 14時02分 公開
[ITmedia]

 富士通研究所は7月30日、分散ストレージの環境で特定データへのアクセス集中を自動的に解消する「レプリカ数動的調整機構」を開発したと発表した。ユーザーのアクセス時間が悪化するのを抑えるもので、2013年度中に製品やサービスへの適用を目指すという。

 レプリカ数動的調整機構は、最近のアクセス状況からデータに重みを付けた「人気度(重み付き人気度)」を少ないメモリ量で推定する「人気度推定エンジン」技術と、アクセスが集中している期間の頻度に合わせてデータを格納するサーバの複製を増減させるための「アクセス集中度分析」技術から構成される。

アクセス集中度分析のイメージ(出典:富士通研究所)

 人気度推定エンジンでは固定個数分だけのデータのアクセス数を常に記録しておき、記録にないデータへのアクセス増加がみられた場合は、アクセス数が最も少ないデータと入れ替え、人気度を推定。突発的にアクセス数が急増するデータも迅速に検出できるという。算出した人気度や予兆からアクセスの集中期間を予想し、予想される規模に応じて人気データを格納しているサーバを複製、その台数を自動的に決定する。

 同社によれば、分散ストレージは大量のデータの格納や、データ損失などの障害対策を目的に導入されるケースが増えているものの、例えば、社会的なニュースなどから突発的なアクセス集中が発生すればサーバ側の処理能力が追いつかなくなり、ユーザーのアクセス時間が大幅に長くなるなど問題があった。

 同社の実証実験では人気歌手に関する大きなニュースから大規模なアクセス集中が発生したと仮定して、64台のサーバを使って新技術の効果を検証。そのケースではアクセス頻度が約2.3倍に増加するが、新技術を適用すれば0.7倍の増加に抑制できることを確認したという。

負荷状態とデータ種別による各方式の相対アクセス時間(同)

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ