日韩免费高清专区-日韩免费高清一级毛片在线-日韩免费高清一级毛片久久-日韩免费高清一级毛片-日韩免费高清完整版-日韩免费高清视频网站

幣圈網

AI遭遇靈魂拷問!這道題所有模型集體翻車 網友:我也不會啊

拷打AI的難度還在升級?這不,圖像推理又出現了新難題。

該問題在Reddit上引起熱議:目前沒有任何AI能真正解決復雜推理問題。

問題定義其實非常簡單——在下圖中還需要添加多少個小立方體能形成一個完整的大立方體?

針對這一難題,國內外支持圖像輸入的大模型紛紛給出了不同的答案。

其中,o3給出的答案是45個,Gemini 2.5Pro給出的答案僅有10個。

而國內大模型,如DeepSeek、Qwen3的答案分別為14和9。

出現這些不同答案的原因是什么呢?請往下看。

為什么會出現不同的答案

核心原因:大模型對組成的大立方體的規格理解不同。

o3將最終組成的大立方體的規格理解為5x5x5,但它對于缺失的小立方體的數目仍舊給出了錯誤答案,用人類視覺來看,要形成5x5x5的大立方體需要125個小立方體,而圖中已經給出了46個,所以答案應該為79。

而AI的錯誤源于它對圖片中小立方體的結構和數目的分析錯誤。

Gemini 2.5 Pro將最終組成的大立方體的規格理解為4x4x4。

而DeepSeek和Qwen都將最終的大立方體規格設定為了3x3x3。

對于最終要組成的大立方體的規模理解不同,各大模型自然而然就會給出不同的答案。

不過,結合提示多次嘗試,也有大模型能夠漸漸找準方向。

網友針對這些錯誤答案提供了一些解決辦法:

例如用o3進行測試,在前兩次嘗試時給出一些小提示,雖然這樣也得到錯誤答案,但第三次,即使沒有提示也得到了正確的結果。

網友認為是由于ChatGPT的長期記憶功能,讓它記住了前兩次嘗試的提示(比如考慮最長運行中有多少個立方體,專注于嚴格計數而不是估計),考慮到了失敗的經驗,并將它們全部整合在一起。

因此,可以說o3會通過記憶來學習。而這道難題也會成為未來的訓練數據。

網友:人類也會困惑

有人說,這根本就不是一個推理問題,而是一個視覺理解問題。

出現作者認為的錯誤答案是由于問題表述不清楚導致AI的分析過程出現了偏差。

甚至人類面對這種問題也會出現類似的困惑,比如題目的要求到底是以原來的排列結構為基礎還是可以打亂結構重新排列?

并且,如果能夠更清晰地為AI解釋圖片內容(告知其圖片中小立方體的排列結構):

那么o3得到的答案也是正確的:

無論是3x3x3、4x4x4還是5x5x5,或者是NxNxN,人類自己都無法統一答案的問題,對AI來說是不是太難了點!

網友:

AI:或許我需要一個更科學的訓練方式!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 女人把扒开给男人爽的 | 国产在线视频欧美亚综合 | 精品无码国产AV一区二区三区 | 天天狠天天天天透在线 | 桥本有菜在线四虎福利网 | 草莓视频网站18勿进 | 毛片影院| 四虎影院久久久 | 久久不射电影网 | 扒开老师挠尿口到崩溃刑罚 | 欧洲网色偷偷亚洲男人的天堂 | 精品视频在线观看 | 欧美一区二区三区久久久 | 好大好爽好硬我要喷水了 | 精品国产无限资源免费观看 | 国产综合亚洲欧美日韩一区二区 | 91精品国产高清久久久久久 | 国产精品第一 | segou视频在线观看 | 全肉一女n男np高h乳 | 五月婷婷在线观看 | 青草视频久久 | 午夜精品久久久久久久2023 | 亚洲日本在线观看网址 | 草草国产成人免费视频 | 久久强奷乱码老熟女 | 特级毛片免费观看视频 | 亚洲精品乱码蜜桃久久久 | 视频一本大道香蕉久在线播放 | aaaa黄 | 激情综合色啪啪小说 | 成人18视频在线观看 | 欧亚专线欧洲m码可遇不可求 | 色综合视频一区二区三区 | 免费成人在线观看视频 | 日韩精品亚洲专区在线影视 | 亚洲国产高清视频 | 高清国产在线观看 | 亚洲欧洲淘宝天堂日本 | free性泰国娇小videos | 国精品午夜dy8888狼人 |