谷歌推出“雙子座全能”多模態(tài)生成模型

2026-05-21 07:22 來源：新華每日電訊

查看余下全文

2026年05月21日 07:22 來源：新華每日電訊

[字號大中小]

新華社舊金山5月19日電（記者吳曉凌）美國谷歌公司19日在年度開發(fā)者大會上宣布推出新一代多模態(tài)生成式人工智能模型“雙子座全能”，首個發(fā)布版本為“雙子座全能閃電”，可根據(jù)文本、圖像、音頻和視頻等多種形式的輸入生成視頻內(nèi)容，并支持用戶用自然語言完成視頻編輯。

谷歌在官方博客中說，“雙子座全能”模型融合了推理能力與生成能力，是“能夠通過任何輸入形式生成任何內(nèi)容”的新模型，目前優(yōu)先應(yīng)用于生成視頻。

據(jù)谷歌介紹，“雙子座全能閃電”已在“雙子座”App、“谷歌流”人工智能工具和優(yōu)兔短視頻等平臺上提供。

谷歌深層思維公司在官網(wǎng)發(fā)布公報說，盡管“雙子座全能閃電”取得顯著進(jìn)展，但在編輯過程中保持完全一致性、生成復(fù)雜運動場景以及渲染完全準(zhǔn)確的文字等方面仍面臨挑戰(zhàn)。

(責(zé)任編輯：劉芃)