今日(8月11日),昆侖萬(wàn)維(300418)啟動(dòng)SkyWork AI技術(shù)發(fā)布周(8月11日至15日),每日發(fā)布視頻生成模型(SkyReels)等五大類多模態(tài)AI模型。這標(biāo)志著其AI技術(shù)全面邁入商業(yè)化階段,前期研發(fā)成果加速轉(zhuǎn)化為產(chǎn)品矩陣,技術(shù)變現(xiàn)飛輪高效運(yùn)轉(zhuǎn)。
技術(shù)周首日,全球首個(gè)支持分鐘級(jí)長(zhǎng)視頻生成的音頻驅(qū)動(dòng)模型SkyReels-A3亮相。該模型以四大技術(shù)創(chuàng)新直擊直播電商萬(wàn)億市場(chǎng)痛點(diǎn),實(shí)現(xiàn)長(zhǎng)視頻連貫生成、影視級(jí)運(yùn)鏡控制與自然動(dòng)作交互,為內(nèi)容創(chuàng)作產(chǎn)業(yè)奠定新一代技術(shù)基石。
技術(shù)突破:構(gòu)建多模態(tài)協(xié)同的生成范式
傳統(tǒng)視頻生成技術(shù)受限于誤差累積效應(yīng),面臨長(zhǎng)視頻畫(huà)面崩壞與動(dòng)作僵硬的行業(yè)瓶頸。模型Skyreels-A3的創(chuàng)新在于構(gòu)建了多模態(tài)協(xié)同的生成范式,保證了畫(huà)面的一致性,基于DiT視頻擴(kuò)散模型框架構(gòu)建,通過(guò)三路輸入處理系統(tǒng)實(shí)現(xiàn)文本、圖像與音頻的深度融合,突破了誤差控制機(jī)制,創(chuàng)新采用分段插幀策略,通過(guò)確定起始幀和終止幀生成視頻片段,并取用尾幀作為插幀監(jiān)督信號(hào),成功將180秒長(zhǎng)視頻的畫(huà)面穩(wěn)定度控制在較高值,徹底解決行業(yè)頑疾。
在藝術(shù)創(chuàng)作的高階美感表達(dá)維度,模型首創(chuàng)基于ControlNet的鏡頭控制模塊,支持固定鏡頭、推鏡、拉鏡、左搖、右搖、抬升、下降、手持鏡頭等8種運(yùn)鏡參數(shù),且強(qiáng)度可自由連續(xù)調(diào)節(jié)。該技術(shù)使非專業(yè)用戶也能精準(zhǔn)控制鏡頭語(yǔ)言,這種能力源自對(duì)影視鏡頭物理軌跡的數(shù)學(xué)建模,顯著提升直播帶貨場(chǎng)景的真實(shí)性,同時(shí)也可以提升音樂(lè)MV、電影片段的藝術(shù)表現(xiàn)力。
針對(duì)直播帶貨等交互場(chǎng)景中,效果不夠逼真的痛點(diǎn),模型通過(guò)DPO算法優(yōu)化手部動(dòng)作自然度,驅(qū)動(dòng)生成效果逼近真人表現(xiàn),該技術(shù)通過(guò)分析大量真實(shí)交互數(shù)據(jù),建立“動(dòng)作—商品—語(yǔ)音”的跨模態(tài)關(guān)聯(lián)。
模型Skyreels通過(guò)Step蒸餾技術(shù),將推理步數(shù)從40步壓縮至4步,畫(huà)面質(zhì)量保持率超98%,使視頻生成時(shí)間縮短至80秒,大幅降低創(chuàng)作者硬件門(mén)檻。人工盲測(cè)進(jìn)一步驗(yàn)證其優(yōu)勢(shì):在帶貨場(chǎng)景,在觀眾盲測(cè)中,89%的人認(rèn)為模型Skyreels呈現(xiàn)的動(dòng)作效果比競(jìng)品更真實(shí)自然,動(dòng)作自然性和面部穩(wěn)定性評(píng)分這兩項(xiàng)關(guān)鍵指標(biāo)均居行業(yè)首位。
商業(yè)化潛力:撬動(dòng)萬(wàn)億市場(chǎng)的創(chuàng)作革命
2023年以來(lái),昆侖萬(wàn)維“All in AGI與AIGC”戰(zhàn)略全面落地,實(shí)現(xiàn)了從技術(shù)研發(fā)到產(chǎn)品商業(yè)化的轉(zhuǎn)變,并獲得了用戶廣泛的認(rèn)可。
昆侖萬(wàn)維2025年第一季度財(cái)報(bào)數(shù)據(jù)顯示,經(jīng)營(yíng)性現(xiàn)金流凈額增長(zhǎng)58.3%,2024年15.4億元的研發(fā)投入正持續(xù)轉(zhuǎn)化為營(yíng)收增長(zhǎng)動(dòng)能。這驗(yàn)證了AI技術(shù)商業(yè)化的可持續(xù)性,使其成為國(guó)內(nèi)首個(gè)跑通“研發(fā)投入—產(chǎn)品變現(xiàn)—現(xiàn)金流反哺”閉環(huán)的AI企業(yè)。
當(dāng)模型SkyReels賦能錨定直播電商領(lǐng)域電影制作、虛擬直播、游戲開(kāi)發(fā)與教育內(nèi)容創(chuàng)作,顯著降低多角色視頻制作門(mén)檻,讓個(gè)性化、交互式內(nèi)容的創(chuàng)作前所未有地高效與便捷。昆侖萬(wàn)維表示,技術(shù)周未來(lái)幾日發(fā)布的其他模型也將開(kāi)辟多元戰(zhàn)場(chǎng),五大模型正編織一張覆蓋全球市場(chǎng)的商業(yè)化網(wǎng)絡(luò)。(燕云)