研究發現大多數AI模型看不懂時鐘及日曆

【2025年05月20日訊】(記者陳俊村報導)近年來,人工智能(AI)被廣泛應用在多種領域,替人類解決了不少問題,但這種炙手可熱的技術並非萬能。最近就有研究發現,AI尚未掌握人們能輕易完成的一些技能。比如說,大多數AI模型看不懂人們熟悉的時鐘和日曆。

英國愛丁堡大學(University of Edinburgh)在新聞稿中指出,該校的研究團隊表示,最先進的AI模型無法可靠地解釋時鐘指針的位置或正確回答有關日曆上日期的問題。

該團隊說,有別於簡單地識別形狀,看懂時鐘和日曆需要結合空間意識(spatial awareness)、背景和基礎數學——這對AI來說仍具有挑戰性。

該團隊測試了處理文字和圖像的AI系統——稱為多模態大型語言模型(Multimodal Large Language Model)——是否可以經由查看時鐘或日曆的圖片來回答與時間相關的問題。

他們測試了各種時鐘設計,包括帶有羅馬數字的時鐘、帶有和不帶有秒針的時鐘以及具有不同顏色的錶盤的時鐘。

結果發現,AI系統準確判斷時鐘指針位置的次數不到四分之一。當時鐘上有羅馬數字或格式化的指針時,錯誤更容易發生。

該團隊說,當時鐘的秒針被移除時,AI系統的表現也沒有任何改善,這意味著這些系統對於秒針的檢測和角度的解讀存在著根深蒂固的問題。

而在日曆方面,研究人員要求AI模型回答一系列與日曆有關的問題,例如識別假期以及計算過去和未來的日期。

他們發現,即使是表現最好的AI模型,也有五分之一的次數會出現日期計算錯誤。比如說,當被問到「今年的第153天是哪一天?」時,AI模型的錯誤率就挺高的。

這項研究的主要報告撰寫人、該校研究人員薩克塞納(Rohit Saxena)說:「大多數人從小就能分辨時間和使用日曆。我們的研究結果凸顯了AI在執行人類基本技能方面所存在的巨大差距。」

該校另一名研究人員傑瑪(Aryo Gema)說:「當今的AI研究經常強調複雜的推理任務,但諷刺的是,許多系統仍難以執行比較簡單的日常任務。」

薩克塞納還表示,如果人們想把AI成功地融入現實世界中對時間很敏感的應用領域(例如排程和自動化)的話,這些問題就必須解決。

上述研究成果發表在線上預印本資料庫arXiv上。研究人員也在4月28日舉行的國際表徵學習大會(International Conference on Learning Representations)上發表了該研究的論文。

「金山紀元網」立足華人社區,服務華人朋友,堅守傳統媒體的良知與價值觀,向民眾傳遞真實的資訊。請關注我們的社媒主頁,及時獲取最新咨詢!
發佈:2025-05-20 15:00 | 修改:2025-05-20 15:00

看完這篇文章您覺得:

已經有 0 次投票 抢沙发
相關文章
文章評論區

发表回复