AI・データサイエンス

富士通研究所、教師データなしで高次元データの特徴を正確に獲得できるAI技術を開発

富士通研究所は7月13日、AIによる検知・判断における精度向上に向け、高次元データの分布・確率などの特徴量を正確に獲得するAI技術「DeepTwin」を開発したと発表した。同社によると、世界で初めての技術だという。

通常、AIの学習には大量の教師データが必要となるが、教師データの作成に要する時間・工数などのコストがかかるため、正解ラベルを付与しない教師なし学習の必要性が増している。しかし、通信や画像など、扱うデータが高次元の場合は、データの特徴を獲得するのが計算量の観点で困難なため、深層学習を使って入力データの次元を削減する手法が用いられていた。同社は、映像圧縮技術とディープラーニングを融合させることで、高次元データの削減すべき次元数と次元削減後のデータの分布を深層学習技術で最適化し、データの特徴量を正確に抽出できるAI技術を開発したという。

本技術をデータマイニングの国際学会「Knowledge Discovery and Data Mining」が配布している通信アクセスデータおよびカリフォルニア大学アーヴァイン校が配布している甲状腺数値データ、不整脈データといった異なる分野での異常検知のベンチマークで、従来のディープラーニングベースの誤り率と比較して最大で37%改善し、全データで世界最高精度を達成したという。本技術は、データの特徴を正確に捉えるというAIの根本的な課題を解く技術であるため、幅広い分野でのAI適用が期待できるとしている。

本技術により、AI分野の重要な課題の一つであるデータの正確な分布や発生確率の獲得が可能となるため、異常データ検知など様々なAI技術の判断精度向上が期待される。

(川原 龍人/びぎねっと)

[関連リンク]
プレスリリース