オープンソース

ヤフージャパン、ビッグデータ分析向け高次元データ検索技術「NGT」をオープンソースソフトウェアとして公開

ヤフージャパンは11月24日、ビッグデータ分析向け高次元データ検索技術「NGT」をオープンソースソフトウェアとして公開した。

「NGT(Neighborhood Graph and Tree for Indexing)」は、テキストや画像、商品、ユーザーデータなど、複数の特徴を持つ「高次元データ」を、大量のデータの中から高速に検索できる技術。言語データにおいては、検索精度(適合率)90%として、200万件の言語データを対象に検索を行った場合、既存の類似技術の中で最も高速な技術「SASH」の検索時間が約2.4ミリ秒かかるのに対して、NGTは最速で約0.6ミリ秒と、約4倍の高速性を実現した。画像特徴データについても適合率90%として類似技術の約5.6倍の高速性を実現している。

「NGT」は、AIやIoTの台頭により、さらに巨大化するビッグデータの分析の高速化に寄与するものと期待されているという。

「NGT」は、GitHubで公開されている。

(川原 龍人/びぎねっと)

[関連リンク]
プレスリリース