AI・データサイエンス

Technology Innovation Institute、オープンソースの大規模言語モデル「Falcon」をリリース

「Technology Innovation Institute」は6月5日(現地時間)、オープンソースの大規模言語モデル「Falcon」をリリースした。

公開されているモデルは、400億個のパラメータを有する「Falcon-40B」、および70億個のパラメータを有する「Falcon-7B」モデル。いずれも、事前学習を終えており、利用する前にファインチューニングを行う必要があるという。「Falcon」はトレーニングに用いたデータによって高品質が保たれている。Webから収集した大規模データセット「RefinedWeb」に対し重複排除、フィルタリングを行ってあるという。

「Falcon」は、機械学習データ共有サイト「Hugging Face」にてモデルが公開されている。

(川原 龍人/びぎねっと)

[関連リンク]
Blogによる記事