オープンソース
ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 1.4」リリース
Apache Software Foundation(ASF)は6月11日(現地時間)、ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 1.4」をリリースした。
「Apache Spark」は、カリフォルニア大学バークレー校のAMPLabで開発されたフレームワーク。インタラクティブなアルゴリズムとデータマイニングに適合するよう、MapReduceを拡張することを目標としている。独自のDAGエンジンを搭載しており、ビッグデータを高速で処理することができるという。
「Apache Spark 1.4」では、「SparkR」を導入したことにより、「R言語」をサポートした。また、「Spark Core」が強化され、複数の機能強化が行われた。その他、機能改善やバグフィクスが施されている。
「Apache Spark 1.4」は、Webサイトから無償で入手できる。
(川原 龍人/びぎねっと)
[関連リンク]
リリースノート