評估 AI 完成長時間任務的能力：Opus 4.5 達成 4 小時 49 分鐘 50% 成功率

一項由 METR 發布的最新研究評估了 AI 模型 Opus 4.5 在執行長時間任務上的表現，結果顯示其在持續 4 小時 49 分鐘的任務中達成了 50% 的成功率。

🧠 白話文解讀這項研究測試了一款名為 Opus 4.5 的 AI 模型能「專注工作」多久。結果發現，它可以持續近 5 小時完成任務，成功率有一半。這就像是在說：這個 AI 可以像人類一樣「加班」，但還不是百發百中。

⚠️ 對你的影響如果你是開發者或企業主，這意味著 AI 工具在處理需要長時間專注的任務（如大型程式碼審查、文件分析）上越來越可靠，但仍需人類監督。