久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當前的位置: 首頁 > 新聞 > 其他

摩爾線程開源音頻理解大模型MooER:38小時訓練5000小時數據

來源:快科技 編輯:非小米 時間:2024-08-23 20:00人閱讀

快科技8月23日消息,摩爾線程官方宣布,音頻理解大模型“MooER”(摩耳)已經正式開源,并公布在GitHub上:https://github.com/MooreThreads/MooER

目前開源的內容包括推理代碼,以及5000小時數據訓練的模型,后續還將開源訓練代碼,以及基于8萬小時數據訓練的模型。

摩爾線程希望,能夠在語音大模型的方法演進和技術落地方面為社區做出貢獻。

MooER是業界首個基于國產全功能GPU進行訓練和推理的大型開源語音模型,依托摩爾線程的夸娥(KUAE)智算平臺,并得益于自研的創新算法和高效計算資源的結合,僅用38個小時,就完成了5000小時音頻數據和偽標簽的訓練。

MooER不僅支持中文和英文的語音識別,還具備中譯英的語音翻譯能力,并在多個語音識別領域的測試集中,展現出了領先或至少持平的優異表現。

摩爾線程開源音頻理解大模型MooER:38小時訓練5000小時數據

MooER的模型結構包括Encoder、Adapter、Decoder(LLM)三個部分。

其中,Encoder對輸入的原始音頻進行建模,提取特征并獲取表征向量。

Encoder的輸出會送到Adapter進一步下采樣,使得每120ms音頻輸出一組音頻Embedding。

音頻Embedding和文本的Prompt Embedding拼接后,再送進LLM進行對應的下游任務,如語音識別(ASR)、語音翻譯(AST)等。

在模型訓練階段,融合了語音模態和文本模態的數據會按以下形式輸入到LLM:

摩爾線程開源音頻理解大模型MooER:38小時訓練5000小時數據

摩爾線程使用開源的Paraformer語音編碼器、Qwen2-7B-instruct大語言模型,初始化Encoder和LLM模塊,并隨機初始化Adapter模塊。

訓練過程中,Encoder始終固定參數,Adapter和LLM會參與訓練和梯度更新。

利用自研的夸娥智算平臺,摩爾線程使用DeepSpeed框架和Zero2策略,基于BF16精度進行訓練和推理。

經實驗發現,訓練過程中更新LLM參數能夠提升最終音頻理解任務的效果。

為了提升訓練效率,摩爾線程采用了LoRA技術,僅更新2%的LLM參數。具體的模型參數規模如下:

摩爾線程開源音頻理解大模型MooER:38小時訓練5000小時數據

該模型的訓練數據MT5K(MT 5000h)由部分開源數據和內部數據構成,內部數據的語音識別標簽均是由第三方云服務得到的偽標簽。

語音識別的偽標簽經過一個文本翻譯模型后,得到語音翻譯的偽標簽,且沒有對這些偽標簽數據做任何的人工篩選。

具體數據來源和對應的規模如下:

摩爾線程開源音頻理解大模型MooER:38小時訓練5000小時數據

摩爾線程將MooER與多個開源的音頻理解大模型進行了對比,包括Paraformer、SenseVoice、Qwen-audio、Whisper-large-v3、SeamlessM4T-v2等。這些模型的訓練規模從幾萬小時到上百萬小時不等。

對比結果顯示,開源模型MooER-5K在六個中文測試集上的CER(字錯誤率)達到4.21%,在六個英文測試集的WER(詞錯誤率)為17.98%,與其它開源模型相比,效果更優或幾乎持平。

特別是在Covost2 zh2en中譯英測試集上,MooER的BLEU分數達到了25.2,顯著優于其他開源模型,取得了可與工業水平相媲美的效果。

基于內部8萬小時數據訓練的MooER-80k模型,在上述中文測試集上的CER達到了3.50%,在英文測試集上的WER到達了12.66%。

與此同時,摩爾線程還得到一些有趣的結論,可以為數據資源和計算資源有限的開發者提供一些建議:

▼Encoder的選擇。

分別對比無監督(Self-Supervised Learning)訓練的W2v-bert 2.0、半監督(Semi-Supervised Learning)訓練的Whisper v3、有監督(Supervised Learning)訓練的Paraformer。

采用無監督訓練得到的Encoder必須參與到訓練過程中,否則模型很難收斂。

綜合考慮模型效果、參數量以及訓練和推理的效率,選擇Paraformer作為Encoder。

▼音頻建模粒度很關鍵。

嘗試使用240ms、180ms和120ms的粒度進行建模,并發現這一參數對音頻與文本的融合效果具有重要影響,同時會影響模型的最終效果和訓練的收斂速度。

經過評估,最終選擇每120ms輸出一個音頻Embedding。

▼快速適應到目標垂類。

僅使用了140h~150h的英文數據進行訓練,可以在6個不同來源的英文的測試集上取得一定效果。

同時嘗試將任務遷移到語音翻譯(AST)領域,取得了很好的效果。

相信這個方法同樣也適用于小語種、方言或其它低資源的音頻理解任務。

▼LLM對音頻理解任務的影響。

在模型訓練過程中采用LoRA技術對LLM參數進行更新,可以使訓練更快收斂,并且最終取得更好的效果。

同時,音頻理解任務上的效果也會隨著基礎LLM效果提升而提升。

更多技術細節,請參考技術文檔:

https://arxiv.org/pdf/2408.05101

本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: 開源 摩爾線程

相關文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
中文精品视频| 在线亚洲一区观看| 久久免费黄色| 亚洲国产国产亚洲一二三| 欧美顶级艳妇交换群宴| 久久免费视频网站| 亚洲精品国产精品国自产观看浪潮| 久久综合九色综合欧美就去吻 | 亚洲裸体视频| 夜夜爽99久久国产综合精品女不卡| 欧美日本一区| 亚洲午夜电影在线观看| 中文亚洲字幕| 激情六月婷婷综合| 亚洲黄色影院| 欧美色播在线播放| 久久激情久久| 男男成人高潮片免费网站| 99亚洲伊人久久精品影院红桃| 日韩网站在线观看| 国产主播精品在线| 亚洲国产一区二区视频| 国产精品毛片一区二区三区 | 欧美影院成年免费版| 久久久综合香蕉尹人综合网| 亚洲精选一区| 久久成人精品一区二区三区| 亚洲精品国产精品乱码不99按摩| 亚洲午夜在线视频| 91久久精品国产91久久| 亚洲永久免费| 亚洲另类黄色| 久久久久久久久久久久久9999| 日韩一级精品视频在线观看| 欧美一区二区大片| 99精品视频免费全部在线| 午夜天堂精品久久久久| 9久草视频在线视频精品| 欧美一区免费视频| 亚洲制服av| 欧美第十八页| 老司机凹凸av亚洲导航| 国产精品国产三级国产aⅴ入口| 免费观看成人| 国产一区二区av| 中文日韩在线| 99精品国产福利在线观看免费| 久久av免费一区| 性色av一区二区三区| 欧美美女福利视频| 欧美大色视频| 黄色成人av在线| 性欧美超级视频| 亚洲女同性videos| 欧美日韩免费一区二区三区视频| 欧美国产日本| 亚洲第一精品电影| 久久精品国产91精品亚洲| 亚洲一区二区三区在线播放| 欧美久久久久中文字幕| 欧美国产精品专区| 亚洲国产成人精品久久| 久久久综合香蕉尹人综合网| 久久久xxx| 国产性猛交xxxx免费看久久| 亚洲一区二区三区高清| 欧美一二区视频| 国产精品日韩高清| 亚洲女人av| 欧美一区二区观看视频| 国产美女高潮久久白浆| 午夜日韩福利| 久久亚洲春色中文字幕| 韩国视频理论视频久久| 久久噜噜噜精品国产亚洲综合| 久久夜精品va视频免费观看| 伊伊综合在线| 欧美久久精品午夜青青大伊人| 亚洲国产色一区| 夜夜夜久久久| 国产精品久久久久999| 亚洲男同1069视频| 麻豆精品传媒视频| 亚洲人成绝费网站色www| 欧美精品一区二区三区在线看午夜| 亚洲国产天堂久久综合网| 99精品免费视频| 国产精品视频精品视频| 久久久99爱| 亚洲国产精品女人久久久| 亚洲午夜日本在线观看| 国产精品自在在线| 久久综合久久综合久久综合| 亚洲国产日韩欧美在线动漫| 亚洲一区二区网站| 国内精品模特av私拍在线观看| 久久综合999| 一区二区三区国产| 麻豆视频一区二区| 宅男精品视频| 国产午夜精品麻豆| 欧美精品一区二区蜜臀亚洲| 亚洲天堂成人在线视频| 欧美二区在线| 午夜免费电影一区在线观看| 在线欧美小视频| 欧美午夜精品久久久久久久| 久久激情网站| 一本色道久久综合亚洲精品高清 | 亚洲精品在线一区二区| 欧美91福利在线观看| 亚洲天堂免费观看| 欧美成人官网二区| 午夜精品久久久久久久| 亚洲国产三级网| 国产麻豆精品久久一二三| 欧美另类一区二区三区| 久久精品九九| 亚洲综合电影| 亚洲开发第一视频在线播放| 免费在线成人av| 欧美在线免费播放| 中文网丁香综合网| 亚洲人成亚洲人成在线观看图片| 国产亚洲精品7777| 国产精品乱码妇女bbbb| 欧美精品久久久久久久| 久久躁日日躁aaaaxxxx| 亚洲欧美一区二区三区久久| 欧美日韩国产一区| 久久gogo国模啪啪人体图| 先锋影音一区二区三区| 亚洲国产天堂久久综合| 性久久久久久久| 午夜亚洲激情| 国产精品magnet| 一本久道久久综合狠狠爱| 亚洲电影免费观看高清完整版在线 | 日韩小视频在线观看专区| 一区二区三区www| 欧美成人精品h版在线观看| 欧美在线亚洲| 午夜精品久久久久| 亚洲欧美一区二区激情| 亚洲天堂av图片| 正在播放亚洲一区| 亚洲网站视频| 亚洲一区3d动漫同人无遮挡| 一二三四社区欧美黄| 一本一本久久a久久精品综合麻豆 一本一本久久a久久精品牛牛影视 | 亚洲一区二区黄色| 这里只有精品丝袜| 国产精品99久久久久久有的能看| 日韩一级精品视频在线观看| 99一区二区| 亚洲视频图片小说| 亚洲欧美国产精品va在线观看| 亚洲欧美日韩天堂| 久久国产手机看片| 久久亚洲欧洲| 欧美精品偷拍| 欧美午夜女人视频在线| 国产精品视频yy9099| 国产欧美一区二区三区在线老狼| 国产精品一二三视频| 国产专区综合网| 亚洲国产精品精华液网站| 亚洲日本激情| 亚洲直播在线一区| 久久午夜电影网| 亚洲黑丝在线| 亚洲天堂激情| 久久免费视频一区| 欧美视频在线免费看| 国产亚洲欧美一区| 亚洲精品视频啊美女在线直播| 在线综合欧美| 久久久午夜视频| 亚洲激情影视| 午夜视频久久久| 欧美大片免费久久精品三p | 狂野欧美激情性xxxx| 欧美日韩国产欧| 国产一区二区三区观看| 亚洲国产专区| 久久国产精品久久久| 亚洲高清中文字幕| 亚洲欧美视频一区| 欧美高清在线播放| 国产亚洲毛片| 亚洲一级影院| 欧美好吊妞视频| 欧美亚洲一级| 欧美色另类天堂2015| 亚洲福利免费| 欧美资源在线观看| 一本色道综合亚洲| 欧美不卡视频| 影音先锋久久精品| 欧美一区二区三区免费视|