农村强奸一级网站|久草京热在线视频|色五月桃花综合激情|亚洲人妻精品主播|欧美无限码中文在线|国产午夜伦理三级|亚洲男女在线播放|欧美日韩成人香蕉视频|全球无码AV1区|中文字幕亚洲五月

投資企業(yè)新聞

啟明星 | Video Rebirth劉威:視頻生成模型是構(gòu)建世界模型的最佳路徑

2025/08/22 | IPO早知道

啟明創(chuàng)投主辦的2025世界人工智能大會(huì)(WAIC)“啟明創(chuàng)投·創(chuàng)業(yè)與投資論壇——?jiǎng)?chuàng)業(yè)投資開(kāi)啟AI技術(shù)與應(yīng)用共振周期”于7月28日在上海世博中心藍(lán)廳成功舉辦。

在本次論壇上,前騰訊杰出科學(xué)家、混元大模型技術(shù)負(fù)責(zé)人,Video Rebirth首席執(zhí)行官劉威以《從視頻生成到世界模型》為題發(fā)表主旨演講。


前騰訊杰出科學(xué)家、混元大模型技術(shù)負(fù)責(zé)人,Video Rebirth首席執(zhí)行官劉威

劉威表示,視頻生成模型是構(gòu)建世界模型的最佳路徑,這一技術(shù)方向有望成為AI從感知向認(rèn)知躍遷的關(guān)鍵突破口。

劉威認(rèn)為,AI技術(shù)發(fā)展正經(jīng)歷從符號(hào)主義到連接主義,再到現(xiàn)實(shí)主義和生成主義的四個(gè)重要階段。特別值得關(guān)注的是,OpenAI在2024年9月發(fā)布的o1模型首次讓AI獲得了真正的推理能力,標(biāo)志著連接主義40年探索的重要突破。當(dāng)前2025年AI正處于關(guān)鍵拐點(diǎn),軟件正向智能體過(guò)渡,智能硬件向物理AI演進(jìn)。

在技術(shù)框架上,劉威提出世界模型應(yīng)具備三大核心能力:模擬能力對(duì)應(yīng)仿真功能,預(yù)測(cè)能力實(shí)現(xiàn)因果推理,探索能力支撐規(guī)劃決策。其中模擬屬于快思考的感知層面,預(yù)測(cè)進(jìn)入了慢思考的認(rèn)知層面,而探索則是主動(dòng)思考,這三大能力正是世界模型的關(guān)鍵所在。

盡管GPT-4o等多模態(tài)模型能夠處理文本、語(yǔ)音、圖片的輸入輸出,但這類模型仍處于被動(dòng)響應(yīng)模式,缺乏對(duì)環(huán)境的整體建模和預(yù)測(cè)能力。相比之下,世界模型需要從被動(dòng)思考轉(zhuǎn)向主動(dòng)思考,從用戶問(wèn)才思考變成能夠主動(dòng)進(jìn)行系列化思考。

SORA的出現(xiàn)為世界模型提供了重要啟發(fā)。劉威指出,SORA首次證明了世界模型的可行性,通過(guò)視頻生成實(shí)現(xiàn)了高度的時(shí)空變化模擬能力。雖然當(dāng)前版本存在一定局限,但已經(jīng)為世界模型的構(gòu)建提供了實(shí)際的技術(shù)起點(diǎn)和可行路徑。

Video Rebirth將視頻原生世界模型定義為世界模擬器加世界預(yù)測(cè)器的組合。當(dāng)前主流的DiT架構(gòu)雖然具備強(qiáng)大的時(shí)空模擬能力,但存在缺乏因果推理、無(wú)法交互干預(yù)等關(guān)鍵問(wèn)題。未來(lái)公司致力于技術(shù)升級(jí)路徑解決上述問(wèn)題,構(gòu)建獨(dú)有的技術(shù)主張和模型范式,迎來(lái)屬于視頻生成領(lǐng)域的“ChatGPT Moment”,推出首個(gè)真正的視頻原生世界模型。

劉威強(qiáng)調(diào),AI不僅需要宏大敘事,更要?jiǎng)?chuàng)造逼真的現(xiàn)實(shí)。Video Rebirth通過(guò)視頻生成切入世界模型這一技術(shù)路徑,有望在AI認(rèn)知能力突破的關(guān)鍵時(shí)期實(shí)現(xiàn)重要技術(shù)創(chuàng)新,為通用人工智能的發(fā)展提供重要支撐。

 

來(lái)源 | IPO早知道