導讀 Mozilla希望讓初創公司、研究人員和業余愛好者更容易構建支持語音的應用程序、服務和設備。為此,它今天發布了最新版本的Common Voice,
Mozilla希望讓初創公司、研究人員和業余愛好者更容易構建支持語音的應用程序、服務和設備。為此,它今天發布了最新版本的Common Voice,這是一個開源的語音數據集,現在包含了來自42000個貢獻者的1400多個小時的語音樣本,涵蓋18種語言,包括英語、法語、德語、荷蘭語、哈卡欽語、世界語、波斯語、巴斯克語、西班牙語、漢語、威爾士語和卡巴語。
Mozilla聲稱它是同一個語言中最大的多語言數據集之一,比八個月前發布的通用語音語料庫大得多。它包含了20000名英語志愿者的500小時和400000條錄音,語料庫很快就會擴展。據該組織稱,目前正在通過通用語音網站和移動應用程序積極收集70種語言的數據。
通用語音可以集成到Deepspeech中,deep speech是一個開源的語音到文本和文本到語音引擎,是由Mozilla的機器學習小組維護的訓練模型。它不僅包含語音片段,還包含志愿者提供的元數據,可用于訓練語音引擎,例如說話者的年齡和性別。
為了簡化這個過程,Mozilla本周推出了一個改進的Common Voice網絡工具,可以根據不同的提示進行編輯,還提供了查看、重新錄制和跳過剪輯的新控件。此外,它引入了一個新的配置文件功能,允許用戶跨語言跟蹤進度和指標,并添加人口統計信息。Mozilla表示,在接下來的幾個月里,它將嘗試不同的方法,通過社區努力和新的合作伙伴關系來提高數據的數量和質量。最終目標是為那些尋求建立和使用語音技術的人提供更多更好的語音數據。
原標題:Mozilla更新后的公共語音數據集現在包括18種語言的1400小時語音。
編輯:李曉玲。
本文就為大家講解到這里。