新華社舊金山5月19日電(記者吳曉凌)美國谷歌公司19日在年度開發(fā)者大會上宣布推出新一代多模態(tài)生成式人工智能模型“雙子座全能”,首個發(fā)布版本為“雙子座全能閃電”,可根據(jù)文本、圖像、音頻和視頻等多種形式的輸入生成視頻內(nèi)容,并支持用戶用自然語言完成視頻編輯。
谷歌在官方博客中說,“雙子座全能”模型融合了推理能力與生成能力,是“能夠通過任何輸入形式生成任何內(nèi)容”的新模型,目前優(yōu)先應(yīng)用于生成視頻。
據(jù)谷歌介紹,“雙子座全能閃電”已在“雙子座”App、“谷歌流”人工智能工具和優(yōu)兔短視頻等平臺上提供。
谷歌深層思維公司在官網(wǎng)發(fā)布公報說,盡管“雙子座全能閃電”取得顯著進(jìn)展,但在編輯過程中保持完全一致性、生成復(fù)雜運動場景以及渲染完全準(zhǔn)確的文字等方面仍面臨挑戰(zhàn)。
(責(zé)任編輯:劉芃)