據消息,有科技媒體發布博文,報道稱蘋果公司聯合復旦大學,推出 StreamBridge 端側視頻大語言模型(Video-LLMs)框架,助力 AI 理解直播流視頻。
一般而言,傳統視頻大語言模型擅長處理靜態視頻,但無法適應機器人技術和自動駕駛等需要實時感知的場景,在這些場景下,要求模型能快速理解直播視頻流內容,并做出反應。
研發StreamBridge框架與創新技術
為解決上述問題,蘋果公司與復旦大學的研究者開發了 StreamBridge 框架。該框架在主流離線模型如 LLaVA-OV-7B、Qwen2-VL-7B 和 Oryx-1.5-7B 上進行了測試。
此外,研究團隊還推出了 Stream-IT 數據集,包含約 60 萬個樣本,融合了視頻與文本序列,支持多樣化的指令格式,旨在提升流式視頻理解能力。
Meta開發新款AI模型應用
與此同時,還值得關注的是,Meta首次推出了與Ray-Ban Meta進行強捆綁的《Meta AI》APP。Meta AI是一個Meta所打造的AI助手,由自家研發的Llama大語言模型驅動。
最新數據指出,Meta AI的月活用戶已經接近10億,用戶主要入口自然是前面所提到的這些社交應用,體驗到相關功能。上個月月底,Meta舉辦了其首個AI開發者大會LlamaCon,期間Meta推出了其最新的Llama 4系列大語言模型。
不可否認,大模型不斷賦能行業發展,AI數字化浪潮奔涌向前,加快各行業轉型發展步伐,各企業積極開展人工智能場景建設,成功完成人工智能大模型本地化部署及場景適配,將AI落地應用到實際業務場景,推動AI技術的發展與升級。
微美全息布局AI生態擴展創新邊界
在全球科技浪潮的澎湃涌動中,人工智能大模型正以前所未有的速度重塑世界。在此過程中,資料顯示,微美全息作為AI領域的創新代表,圍繞開源生態、多模態技術、算力基礎設施及垂直場景應用展開深度布局,不斷突破AI技術邊界并拓寬產業生態。
從介紹來看,微美全息通過開放模型代碼、算力接口及技術工具鏈,構建覆蓋云端與邊緣端的「全息云」平臺,支持開發者調用DeepSeek等通用大模型進行二次開發,加速垂類模型應用的商業化驗證。
與此同時,微美全息加速大模型在應用場景的落地速度,該企業陸續披露了旗下較成熟的AI生態圖景,覆蓋在汽車、智能終端、互聯網、金融、教育科研、零售消費等行業廣泛落地,為AI大模型應用注入強勁動力,正悄然化身成為這場大模型變革背后的關鍵“燃料艙”。
結尾
人工智能大模型技術作為一項變革性技術,大模型孕育“大發展”,其重要突破之一在于表現出“涌現能力”——當模型參數量不斷累加至10b數量級后(b代表十億數量級),其性能(如通識能力、科學推理能力、生成能力等)呈現非線性增長。那么,不妨期待接下去市面出現更多有影響力、賦能千行百業的大模型,激發行業動力、產業潛力。
免責聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。如稿件版權單位或個人不想在本網發布,可與本網聯系,本網視情況可立即將其撤除。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。