この記事のポイント
- Google、発話障がい者向けプロジェクト「Project Euphonia(プロジェクト ユーフォニア)」の、開発者向けプラットフォーム「GitHub」でのリポジトリ公開を発表
- 研究用にパーソナライズされた音声ツールを開発したり、多様な音声パターンに合わせたモデルをトレーニングしたりすることが可能に
- アフリカの非英語話者向け音声認識技術向上への取り組みも発表
Google は 2025 年 5 月 15 日(木)、脳卒中 / ALS / 脳性麻痺 / 外傷性脳損傷 / パーキンソン病などによる発話障がいを患う方の音声を「Google アシスタント」に認識させるプロジェクトとして 2019 年に立ち上げた「Project Euphonia(プロジェクト ユーフォニア)」の、開発者向けプラットフォーム「GitHub」でのリポジトリ公開を発表しました。
「Project Euphonia」は、Google のコンピューターサイエンス / AI 研究開発部門「Google Research」によって進められている、発話障がいに対応する音声認識研究活動です。当初は英語環境にて研究が進められていましたが、2022 年には日本語 / フランス語 / ヒンディー語 / スペイン語にも拡大されています。
そして今回オープンソースとして、この「Project Euphonia」が「GitHub」にてリポジトリが公開されました。これにより、研究用にパーソナライズされた音声ツールを開発したり、多様な音声パターンに合わせたモデルをトレーニングしたりすることができるようになっています。
このほか Google は、社会奉仕事業「Google.org」と英国総合国立大学「ユニヴァーシティ・カレッジ・ロンドン」の提携によって設立した「デジタル言語インクルージョンセンター(CDLI)」において、新たにアフリカの 10 言語のオープンソースデータセットを作成し、アフリカの非英語話者向け音声認識技術向上への取り組みも発表しています。
Source:Google
コメントを残す