オープンソース

NEC、クラスタ型サーバの障害復旧を高速・低コストで実現する技術を開発

NECは11月18日、1000台クラスの大規模クラスタ型サーバの障害を、高速かつ低コストに復旧する「高速リカバリ技術」を開発したと発表した。

この技術では、障害を短時間に発見し、プロセスを高速で復元する技術を採用している。これにより、Linuxによる同規模のクラスタの障害を10秒未満に短縮したという。

「高速リカバリ技術」の特徴は次の通り
○大規模構成に対応したクラスタ監視方式
従来は、監視用サーバでの処理がボトルネックとなっており、監視対象のコンピュータ数が増やせなかった。本方式では、監視用サーバに送るモニタリングデータのサイズを通常時と高負荷時で変えることで、監視用サーバの負荷を削減し、1000台規模のクラスタ型サーバの監視と、数秒以内の障害発見を実現した。

○高速かつ低コストなプロセスリカバリ方式
プロセスの複製データ中で、最近アクセスされていない部分をストレージに保持することで、複製を保持するためのメモリの使用量を1/3〜1/10に削減する。これによって、障害が発生したときの復旧時間を数秒程度に短縮した。

同社では、この技術により、電子政府やショッピングモールなどの情報サービスを提供する大規模なサーバの停止時間を短縮し、信頼性を大幅に向上することを目指すという。

(川原 龍人/びぎねっと)

[関連リンク]
プレスリリース