オープンソース

ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 3.0.0」リリース

2020.06.23
オープンソース

Apache Software Foundationは7月11日(現地時間)、ビッグデータを並列処理するクラスタコンピューティングフレームワーク「Apache Spark 3.0.0」をリリースした。

「Apache Spark」は、カリフォルニア大学バークレー校のAMPLabで開発されたフレームワーク。インタラクティブなアルゴリズムとデータマイニングに適合するよう、MapReduceを拡張することを目標としている。独自のDAGエンジンを搭載しており、ビッグデータを高速で処理することができるという。

「Apache Spark 3.0.0」では、Adaptive Query Execution（AQE）に強化が加わっているほか、GPUなどのアクセラレータを認識できるスケジューラが追加されるなど、いくつかの機能の追加、コアの安定性向上が図られている。

「Apache Spark 3.0.0」は、Webサイトから無償で入手できる。

(川原龍人/びぎねっと)

[関連リンク]
リリースノート