AI・データサイエンス

OpenAI、簡単生成の言語モデル「GPT-2」をオープンソースとして公開

OpenAIは2月14日(現地時間)、簡単生成の言語モデル「GPT-2」の限定版をオープンソースソフトウェアとして公開した。

 この技術が悪意あるアプリに流用される懸念から、GPT-2をオープンソース化はせず、縮小版モデルと論文のみ公開した。

 「GPT-2」は、ネットにある40Gbytesの文章の、次の単語を予測するように訓練された言語モデル。固定された訓練用データセットを使わず、Webページのデータセットをそのまま訓練に使っている。文章の冒頭の文章を与えると、与えられたテキストの文体と内容に適応した文章を生成するという。

 「GPT-2」は、文章作成に応用できるものの、フェイクニュースの生成やなりすましなどに悪用される懸念があるため、今回、機能限定版のみが公開されたという。「GPT-2」の機能限定版は、GitHubに公開されている。

(川原 龍人/びぎねっと)

[関連リンク]
Blogによる記事