久久人人妻人人做人人爽涩爱|人妻少妇精品视频一区二区|99热只有这里有99精品|91久久国产青草亚洲,性高朝久久久久久久,成全免费看高清电影,日本欧美一区二区三区在线

科大訊飛聲音復(fù)刻與超擬人能力迎突破 語(yǔ)音合成技術(shù)再升級(jí)
來(lái)源:證券時(shí)報(bào)網(wǎng)作者:葉玲珍2025-06-27 20:46

6月26日,科大訊飛語(yǔ)音合成技術(shù)迎來(lái)全新升級(jí),一句話聲音復(fù)刻與超擬人合成兩大核心能力實(shí)現(xiàn)突破。專業(yè)測(cè)評(píng)數(shù)據(jù)顯示,公司一句話聲音復(fù)刻技術(shù)在相似度、準(zhǔn)確度等維度處于行業(yè)領(lǐng)先水平。

科大訊飛研究院院長(zhǎng)劉聰表示:“我們希望聲音不止于工具,更成為承載情感與個(gè)性的新維度,賦能更多場(chǎng)景行業(yè)、催生更多可能。”

2024年4月,訊飛星火APP上線“一句話聲音復(fù)刻”功能,廣受用戶好評(píng)。本次技術(shù)突破,除星火語(yǔ)音大模型底座的基礎(chǔ)和持續(xù)迭代外,還構(gòu)建了一套三階段層次化語(yǔ)音建模框架:首先通過(guò)星火底座大模型精確捕捉發(fā)音規(guī)律和韻律特征;其次,在音色恢復(fù)階段解耦并重構(gòu)聲學(xué)特征;最后,通過(guò)高精度聲碼器恢復(fù)高保真波形。

據(jù)悉,在智能語(yǔ)音領(lǐng)域,聲音復(fù)刻效果的核心指標(biāo)圍繞相似度與準(zhǔn)確度兩大維度展開。相似度決定“第一耳印象”,包含音色特質(zhì)及風(fēng)格韻味;準(zhǔn)確度則關(guān)乎聲音復(fù)刻是否好用,確保發(fā)音標(biāo)準(zhǔn)、停頓自然、語(yǔ)氣連貫。

本次科大訊飛在聲音復(fù)刻場(chǎng)景針對(duì)性進(jìn)行兩項(xiàng)關(guān)鍵技術(shù)的嘗試與突破,一是音色編碼增強(qiáng),即在聲學(xué)模型中創(chuàng)新性地融合全局聲紋嵌入與局部幀級(jí)音色編碼,提取細(xì)粒度音色特征,并構(gòu)建聲紋空間語(yǔ)義一致性損失函數(shù),顯著提升音色恢復(fù)的相似度;二是強(qiáng)化學(xué)習(xí),通過(guò)語(yǔ)音魯棒性評(píng)價(jià)模型和人工標(biāo)注構(gòu)建偏好數(shù)據(jù)集,采用基于DPO的強(qiáng)化學(xué)習(xí)策略,大幅提升合成語(yǔ)音的穩(wěn)定性和自然流暢度。

從曾經(jīng)要錄上數(shù)十個(gè)小時(shí)的語(yǔ)音素材,到錄入幾段話,再到現(xiàn)在僅用一句話就能復(fù)刻聲音,語(yǔ)音合成技術(shù)一直在向更快、更好、更易用的方向進(jìn)階。業(yè)內(nèi)人士表示,一句話復(fù)刻技術(shù)的突破,顯著降低了應(yīng)用門檻,在AI賦能千行百業(yè)的大背景下,讓更多的場(chǎng)景和行業(yè)衍生出更多的個(gè)性化需求。

值得一提的是,在需要深入交流的場(chǎng)景里,僅有相似音色并不足夠??拼笥嶏w本次突破的超擬人合成技術(shù),重點(diǎn)是賦予AI聲音以“上下文情商”。通過(guò)研發(fā)上下文感知的語(yǔ)音生成系統(tǒng),融合歷史文本及對(duì)應(yīng)音頻特征,實(shí)現(xiàn)跨模態(tài)編碼器分析上下文,讓AI聲音能像真人一般敏銳響應(yīng)情緒轉(zhuǎn)變和話題轉(zhuǎn)換,整體自然度接近真人水平。

當(dāng)前,科大訊飛AI語(yǔ)音技術(shù)已在各行各業(yè)落地生根,其中智能座艙領(lǐng)域應(yīng)用成果最為顯著。今年初,蔚來(lái)在“Banyan 榕 3.1.0版本”中為NOMI助手引入的超擬人情感音色,正源于科大訊飛的深度賦能,搭載該技術(shù)的蔚來(lái)新車型(如ET9、新ES6/EC6/ET5系列等),成為行業(yè)首款應(yīng)用AI生成式語(yǔ)音合成框架的車型。除蔚來(lái)外,奇瑞、廣汽、長(zhǎng)城、日產(chǎn)、本田等主流車企均選擇了訊飛超擬人技術(shù)。

其他行業(yè)方面,星火語(yǔ)音大模型技術(shù)底座已服務(wù)全國(guó)5萬(wàn)余所學(xué)校、600家醫(yī)院及眾多金融機(jī)構(gòu)。

在教育領(lǐng)域,星火大模型賦能的AI學(xué)習(xí)機(jī)已能像真人教師般開展多輪對(duì)話診斷學(xué)情,為學(xué)生定制個(gè)性化學(xué)習(xí)路徑;在數(shù)字內(nèi)容創(chuàng)作領(lǐng)域,訊飛智作平臺(tái)的超擬人數(shù)字人技術(shù)實(shí)現(xiàn)“一張照片+一句話錄音”定制專屬虛擬人,該技術(shù)已幫助天津大學(xué)教師打造慕課個(gè)人IP,簡(jiǎn)化教學(xué)視頻制作流程;在醫(yī)療領(lǐng)域,搭載情感合成技術(shù)的導(dǎo)診機(jī)器人使用方言與老年患者交流時(shí),對(duì)話自然度提升200%。

責(zé)任編輯: 王小偉
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無(wú)評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換