本站9月2日消息,今日,騰訊混元官方宣布,HunyuanWorld-Voyager(簡稱混元Voyager)正式發布,這是業界首個支持原生3D重建的超長漫游世界模型。
該模型在斯坦福大學李飛飛團隊發布的世界模型基準測試WorldScore上位居綜合能力首位,超越現有開源方法,在視頻生成和3D重建任務中均表現出色。
在視頻生成和視頻3D重建兩個任務上,Voyager也均取得更好的結果。
據介紹,混元Voyager聚焦于AI在空間智能領域的應用擴展,將為虛擬現實、物理仿真、游戲開發等領域提供高保真的3D場景漫游能力。
模型突破傳統視頻生成在空間一致性和探索范圍上的局限,能夠生成長距離、世界一致的漫游場景,支持將視頻直接導出為3D格式。
據了解,混元Voyager 3D輸入-3D輸出的特性,與此前已開源的混元世界模型1.0高度適配,可進一步擴展1.0模型漫游范圍,提升復雜場景的生成質量,并可對生成的場景做風格化控制和編輯。
此外,該模型可支持視頻場景重建、3D物體紋理生成、視頻風格定制化生成、視頻深度估計等多種3D理解與生成應用。
官方表示,混元Voyager首次通過空間與特征結合的方式,支持原生的3D記憶和場景重建,避免了傳統后處理帶來的延遲和精度損失。
同時,在輸入端加入3D條件保證畫面視角精準,輸出端直接生成3D點云,適配多種應用場景。
額外的深度信息還能支持視頻場景重建、3D物體紋理生成、風格化編輯和深度估計等功能。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。