オープンソース

ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 1.5」リリース

Apache Software Foundationは9月9日(現地時間)、ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 1.5」をリリースした。

「Apache Spark」は、カリフォルニア大学バークレー校のAMPLabで開発されたフレームワーク。インタラクティブなアルゴリズムとデータマイニングに適合するよう、MapReduceを拡張することを目標としている。独自のDAGエンジンを搭載しており、ビッグデータを高速で処理することができるという。

「Apache Spark 1.5」では、コードを一部書き換えることによって、ボトルネックとなっていたメモリ管理の部分などを改善し、CPUキャッシュメモリを利用できるように改善した。その他にも、複数の機能改善が施されている。

「Apache Spark 1.5」は、Webサイトから無償で入手できる。

(川原 龍人/びぎねっと)

[関連リンク]
リリースノート