今年3月初,AI智能體Manus的橫空出世,使得AI智能體開始受到大量關(guān)注,但Manus僅在3個(gè)月后便迅速撤出了中國市場。在Manus撤離后的這段時(shí)間內(nèi),智譜等國內(nèi)大廠迎頭趕上,各自發(fā)布了大量的智能體產(chǎn)品。
8月20日,智譜正式發(fā)布AutoGLM 2.0。該產(chǎn)品由純國產(chǎn)模型GLM-4.5與GLM-4.5V驅(qū)動(dòng),具備推理、代碼以及多模態(tài)處理能力,可在多種設(shè)備和場景中運(yùn)行,現(xiàn)已面向普通用戶開放。
與常見的移動(dòng)端AI助手不同,AutoGLM 2.0定位于能夠在設(shè)備上執(zhí)行具體操作的智能體。
AutoGLM是智譜推出的智能體產(chǎn)品,支持一句話實(shí)現(xiàn)云端操作與自動(dòng)執(zhí)行。據(jù)智譜介紹,過去的AI多停留在“對(duì)話”層面,只能回答問題;一般的Agent(智能體)助手也多局限于信息查詢和總結(jié)。AutoGLM 2.0則實(shí)現(xiàn)一大突破,不再只是“說”,而是真正能夠“做”,AutoGLM 2.0已經(jīng)成長為一名執(zhí)行型助手,能夠在云端自主完成多樣化的任務(wù)。
從DEMO演示來看,在生活場景中,用戶只需一句話,就能讓AutoGLM 操作抖音、小紅書、美團(tuán)、京東等40多個(gè)高頻應(yīng)用,可以點(diǎn)外賣、訂機(jī)票、查房源、預(yù)約健康服務(wù),例如幫用戶買“秋天的第一杯奶茶”。
在辦公場景中,AutoGLM同樣能跨應(yīng)用執(zhí)行全流程工作,從信息檢索到內(nèi)容撰寫,再到生成1分鐘短視頻、PPT或播客,并直接完成小紅書發(fā)布。
在AutoGLM 2.0中,智譜為AI配備了專屬云手機(jī)和云電腦。Agent可以在云端自主干活、完成任務(wù),而無需占用用戶的本地設(shè)備,期間用戶可以使用其它APP,如刷抖音、打游戲等。這意味著AutoGLM 2.0不僅能“自動(dòng)駕駛手機(jī)”,還可異步“代理辦公”,讓手機(jī)真正變成具備自主執(zhí)行、跨端協(xié)作能力的智能體手機(jī)。
智譜表示,本次發(fā)布的AutoGLM 2.0偏向C端應(yīng)用,面向普通個(gè)人用戶,融合技術(shù)模型能力與產(chǎn)品形態(tài),解決日常及工作任務(wù),更注重用戶體驗(yàn),能突破用戶自身能力邊界,如用戶不懂的事情可通過AI完成。
值得一提的是,AutoGLM是首個(gè)純國產(chǎn)模型驅(qū)動(dòng)的Agent,采用了其自主研發(fā)的最新模型GLM-4.5與GLM-4.5V,具備推理、代碼與多模態(tài)的能力。
據(jù)智譜AutoGLM技術(shù)負(fù)責(zé)人、算法研究員劉瀟介紹,AutoGLM 2.0采用了三大關(guān)鍵技術(shù),一是端到端強(qiáng)化學(xué)習(xí),讓模型通過最終結(jié)果反饋?zhàn)灾魈剿鹘鉀Q問題,而非僅模仿人類軌跡,支持動(dòng)態(tài)適應(yīng)應(yīng)用迭代和環(huán)境變化;二是低成本高效模型,基于智譜自主研發(fā)的模型,單次任務(wù)成本約0.2美元,僅為傳統(tǒng)API方式的1/10—1/20,且可規(guī)?;档?;三是全端適配,支持手機(jī)、電腦、AI 眼鏡等多設(shè)備,通過云技術(shù)解決不同系統(tǒng)適配問題。
此前在7月28日晚間,智譜發(fā)布新一代旗艦?zāi)P虶LM-4.5,這是一款專為智能體應(yīng)用打造的基礎(chǔ)模型,首次在單個(gè)模型中實(shí)現(xiàn)將推理、編碼和智能體能力原生融合,以滿足智能體應(yīng)用的復(fù)雜需求。
隨后在8月11日,智譜宣布推出開源視覺推理模型GLM-4.5V,總參數(shù)106B,激活參數(shù)12B,其實(shí)現(xiàn)了模型原生的GUI任務(wù),也就是從看圖、看片到讀文檔、識(shí)別并操作GUI界面,都能做到從理解到執(zhí)行的閉環(huán)。