繼微軟之后,谷歌也全面擁抱人工智能(AI)智能體(Agent)。在開(kāi)發(fā)者大會(huì)上,谷歌宣布要讓智能體全面進(jìn)駐谷歌的主打業(yè)務(wù)搜索以及AI助手Gemini,并通過(guò)Gemini與搜索結(jié)合,推出全新的AI模式搜索。
當(dāng)?shù)貢r(shí)間5月20日,谷歌2025年度I/O開(kāi)發(fā)者大會(huì)的主題演講展示了在AI、多模態(tài)模型、跨設(shè)備整合與開(kāi)發(fā)者工具方面的最新成果。從升級(jí)后的Gemini 2.5 Pro模型到智能眼鏡的XR應(yīng)用,再到AI驅(qū)動(dòng)的搜索與網(wǎng)頁(yè)瀏覽體驗(yàn)。谷歌展現(xiàn)的不僅是模型的性能提升,更是AI從“信息工具”進(jìn)化為“通用智能體”的進(jìn)步。
本次發(fā)布內(nèi)容主要包括:
模型:Gemini 2.5 Pro/Flash/DeepThink;Diffusion;Imagine 4;Lyria;
應(yīng)用:Gemini App、Canvas、Chrome助理、AI Mode、Agent模式;
搜索:AI Overview+Mode;支持個(gè)性化、多步推理、自動(dòng)執(zhí)行任務(wù);
創(chuàng)作:Flow平臺(tái)、文本轉(zhuǎn)圖像、圖像轉(zhuǎn)視頻、原生音頻合成|
硬件:Android XR頭顯、智能眼鏡原型、WearOS、車載整合
谷歌最強(qiáng)通用AI模型Gemini 2.5 Pro
剛開(kāi)場(chǎng),登臺(tái)的Alphabet兼谷歌CEO皮查伊(Sundar Pichai)就強(qiáng)調(diào)了Gemini的重要性,稱“在谷歌,每天都是Gemini季”,并力推新模型Gemini 2.5 Pro——“迄今為止我們最強(qiáng)大的通用AI模型”。
皮查伊說(shuō),自上次I/O大會(huì)以來(lái),谷歌已推出十多款模型和20項(xiàng)AI功能,谷歌的發(fā)布速度已經(jīng)是史上最快:
“我們希望盡快將最好的模型和產(chǎn)品交到大家手中,因此我們的發(fā)布速度比以往任何時(shí)候都快。”
皮查伊透露,Gemini 2.5 Pro模型已在大語(yǔ)言模型(LLM)測(cè)評(píng)LLM Arena的所有類別排行榜上名列前茅。Gemini是熱門AI代碼編輯器Cursor上增長(zhǎng)最快的模型。
他介紹,一年來(lái),谷歌系統(tǒng)每月處理的token數(shù)量激增,從去年的9.7萬(wàn)億增加到現(xiàn)在的480萬(wàn)億,增長(zhǎng)將近50倍。Gemini的App每月有4億多活躍用戶。
“智能體模式”將上線Chrome、搜索及Gemini App
皮查伊宣布,谷歌將在Chrome瀏覽器、搜索以及Gemini的App中推出智能體模式(Agent Mode)。
智能體可以與瀏覽器和其他軟件進(jìn)行交互和操作。谷歌研究的AI智能體Mariner現(xiàn)在可以同時(shí)管理多達(dá)10個(gè)任務(wù),用戶只需向其展示一次任務(wù),它就會(huì)學(xué)習(xí)該任務(wù),并將經(jīng)驗(yàn)用于未來(lái)的案例。
智能體模式的實(shí)驗(yàn)版即將向Gemini App的訂閱者推出。
皮查伊現(xiàn)場(chǎng)演示Gemini App中的智能體模式,要求它幫用戶找公寓。得到指令后,Gemini搜索房產(chǎn)網(wǎng)Zillow,用電腦調(diào)整篩選條件,并使用模型上下文協(xié)議MCP預(yù)約看房。
皮查伊評(píng)價(jià):
“這是一個(gè)新興的時(shí)代。將研究成果轉(zhuǎn)化為現(xiàn)實(shí)的最佳方式就是讓它真正發(fā)揮作用?!?/p>
他說(shuō),在經(jīng)用戶許可的情況下,Gemini現(xiàn)在可以在各種App中以“私密安全”的方式使用個(gè)人信息。
在AI綜述的基礎(chǔ)上,谷歌在搜索引擎中正式推出由Gemini2.5模型驅(qū)動(dòng)的AI模式。由于AI的特性,用戶可以向搜索引擎提出更復(fù)雜、更難的問(wèn)題。谷歌表示,現(xiàn)在用戶從搜索引擎中得到的不只是信息,而是智慧。
圖片來(lái)源:視頻截圖
未來(lái)谷歌還將AI模式與用戶郵箱等個(gè)人信息打通,提供個(gè)性化的建議。與此同時(shí),同類AI工具中常見(jiàn)的“深度研究”功能也將集成在這個(gè)模式中。
同時(shí)通過(guò)將先進(jìn)多模態(tài)模型和實(shí)時(shí)對(duì)話等功能結(jié)合,谷歌也將在今年夏天推出實(shí)時(shí)影像搜索功能。用戶可以開(kāi)著攝像頭向AI實(shí)時(shí)提問(wèn)。
圖片來(lái)源:視頻截圖
谷歌搜索添加AI模式標(biāo)簽頁(yè)支持長(zhǎng)達(dá)數(shù)百字提問(wèn)
皮查伊稱AI概覽(AI Overviews)是谷歌最成功的產(chǎn)品之一,每月有15億用戶在搜索中使用AI概覽,它推動(dòng)某些類型的查詢?cè)鲩L(zhǎng)了10%。這意味著,谷歌提供生成式AI服務(wù)的用戶規(guī)模超過(guò)其他公司。
Gemini模型將與谷歌搜索集合。它將通過(guò)AI模式(AI Mode)增強(qiáng)智能,成為一種強(qiáng)大的新型AI搜索功能,可幫助解答問(wèn)題。它是搜索中的新標(biāo)簽頁(yè),也將包含在AI概覽中。
作為全新的搜索功能,AI模式讓用戶可以提出更長(zhǎng)、更復(fù)雜的查詢。它支持長(zhǎng)達(dá)數(shù)百字的提問(wèn)、自動(dòng)分解查詢意圖、并生成結(jié)構(gòu)化答案。該模式當(dāng)?shù)貢r(shí)間5月20日就上線,作為搜索的新標(biāo)簽頁(yè)形勢(shì),向所有美國(guó)的用戶推出。
新版本中,用戶可以:
直接通過(guò)自然語(yǔ)言發(fā)問(wèn),系統(tǒng)會(huì)提供摘要式、結(jié)構(gòu)化回答。
與搜索結(jié)果進(jìn)行多輪對(duì)話,進(jìn)一步深入了解相關(guān)內(nèi)容。
獲取圖文并茂的“智能回答卡片”,例如自動(dòng)整理出旅游行程、購(gòu)物建議、編程指南等。
皮查伊稱:“我們正在重新定義搜索的未來(lái)。不是找到鏈接,而是直接給出答案?!?/p>
谷歌搜索負(fù)責(zé)人Liz Reid介紹,AI模式會(huì)得到名為Deep Research的模型加持,谷歌稱之為“深度搜索”(DeepSearch)。該模型將通過(guò)邏輯搜索結(jié)果和高度相關(guān)的內(nèi)容,更好地整理研究主題。
“就像你身邊有一位博學(xué)助理?!彼€會(huì)結(jié)合地圖、評(píng)論、視頻等生成圖表和推薦內(nèi)容。
Reid說(shuō),AI模式將擁有谷歌所有最優(yōu)秀的AI特性和功能。“隨著時(shí)間的推移,我們將逐步將AI模式的許多尖端特性和功能融入核心搜索體驗(yàn)。”她還說(shuō),AI模式現(xiàn)在就將支持AI概覽。
谷歌光束、同聲傳譯功能
谷歌光束(Google Beam):極具未來(lái)主義的視頻會(huì)議設(shè)備,從不同角度捕捉用戶影像,使用AI技術(shù)將這些視頻流合并,并在3D光場(chǎng)顯示器上呈現(xiàn)用戶的3D形象,幀率最高可達(dá)每秒60幀。首批“谷歌光束”設(shè)備將于今年晚些時(shí)候通過(guò)合作伙伴惠普推出,具體定價(jià)尚不清楚。
圖片來(lái)源:視頻截圖
同聲傳譯:在谷歌會(huì)議軟件Google Meet中,用戶可以使用不同語(yǔ)言進(jìn)行實(shí)時(shí)對(duì)話,同時(shí)保留原聲的音色、語(yǔ)調(diào)和情感表達(dá)。目前已經(jīng)向訂閱用戶開(kāi)放英語(yǔ)和西班牙語(yǔ)之間的實(shí)時(shí)翻譯,未來(lái)幾周將陸續(xù)增加意大利語(yǔ)、德語(yǔ)和葡萄牙語(yǔ)等更多語(yǔ)言。
圖片來(lái)源:視頻截圖
此外,AI模式下也將提供購(gòu)物決策的全流程支持——從“買什么”到“去哪里買”一步到位。谷歌也在實(shí)驗(yàn)室中推出虛擬試穿衣服工具,用戶可以上傳一張自己的照片,直觀感受購(gòu)物車?yán)锏囊路按┰凇弊约荷砩系臉幼印?/p>
AI視頻生成制作工具Flow
這款工具旨在簡(jiǎn)化AI生成視頻的創(chuàng)作流程。Flow與Veo 3視頻生成模型,針對(duì)Veo 2模型的更多控制功能,以及圖像生成模型Imagen 4一同亮相。
通過(guò)Flow,用戶可以通過(guò)文字或圖片素材生成8秒的AI視頻片段,隨后使用Flow的場(chǎng)景構(gòu)建工具將多個(gè)片段拼接成完整視頻。
與此同時(shí), Veo 3模型不僅生成質(zhì)量更高、理解提示詞更準(zhǔn)確,還能同步生成視頻和音頻,包括不同角色的對(duì)話。此外,Veo 2將增加相機(jī)控制和對(duì)象移除等工具,Imagen 4在生成圖片時(shí)也能準(zhǔn)確生成真實(shí)文本,而不是一堆亂碼。
推出的安卓XR平臺(tái)針對(duì)一系列AI眼鏡設(shè)備
谷歌工程主管Shahram Izadi介紹稱,除了手機(jī)外,未來(lái)幾個(gè)月里谷歌將會(huì)把Gemini AI功能拓展至智能手表、汽車控制臺(tái)、電視上,以及你的眼鏡上。
Izadi介紹稱,谷歌推出的安卓XR平臺(tái)針對(duì)一系列AI眼鏡設(shè)備,意味著每個(gè)人可能會(huì)購(gòu)買不止一副AI眼鏡。例如看電影或者工作時(shí),你需要更具沉浸感的頭戴式設(shè)備;而出行購(gòu)物時(shí),你會(huì)需要輕便的眼鏡提供實(shí)時(shí)信息。
圖片來(lái)源:視頻截圖
安卓XR是谷歌與三星、高通一起開(kāi)發(fā)的平臺(tái),自從去年公布項(xiàng)目后,現(xiàn)在已經(jīng)有數(shù)百家軟件開(kāi)發(fā)商為這個(gè)平臺(tái)提供適配。三星的Project Moohan是第一款安卓XR設(shè)備,并將在今年晚些時(shí)候開(kāi)放購(gòu)買。
谷歌也宣布,與中國(guó)AR品牌Xreal達(dá)成戰(zhàn)略合作,以Project Aura的名義推出第二款安卓XR設(shè)備,也是首款搭載安卓XR平臺(tái)的AR眼鏡。