AI・データサイエンス

レアゾン・ホールディングス、高精度日本語音声認識・音声コーパス「ReazonSpeech」リリース

レアゾン・ホールディングスは1月18日、高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス「ReazonSpeech」をリリースした。

「音声コーパス」とは、音声データとテキストデータを発話単位で対応付けて集めたもの。音声認識モデルを作成する材料として使用され、その規模と品質が音声認識の精度を左右する。

「ReazonSpeech」とは、レアゾン・ヒューマンインタラクション研究所が開発した高精度な音声認識モデルを中心とするプロダクト群。以下のプロダクトからなる。

○ReazonSpeech音声認識モデル: OpenAI Whisperに匹敵する高精度な日本語音声認識モデル。商用利用可
○ReazonSpeechコーパス作成ツール: TV録画データ等から音声コーパスを自動抽出するソフトウェアツール。商用利用可
○ReazonSpeech音声コーパス: 世界最大19,000時間の高品質な日本語音声認識モデル学習用コーパス

これらはいずれも無償で公開されている。

「ReazonSpeech」を用いた文字起こしサービスのテストは、Webサイトで無償で行うことができる。

(川原 龍人/びぎねっと)

[関連リンク]
プレスリリース(prtimes)