Gate 廣場|3/5 今日話題: #比特币创下近一月新高
🎁 解讀行情走勢,抽 5 位錦鯉送出 $2,500 仓位體驗券!
隨著白宮表示已向參議院提交凱文·沃什擔任美聯儲主席的提名,美國參議院未通過叫停特朗普打擊伊朗的投票,比特幣於今日凌晨創下 2 月 5 日以來新高,最高觸及 74,050 美元,加密貨幣總市值回升突破 2.538 萬億美元。
💬 本期熱議:
1️⃣ 凱文·沃什的提名是否意味著降息預期升溫?
2️⃣ 當前關口,你是持幣待漲、順勢追多,還是反手布局回調?
分享觀點,瓜分好禮 👉️ https://www.gate.com/post
📅 3/6 15:00 - 3/8 12:00 (UTC+8)
最近十年,衡量人工智能進步的辦法很簡單粗暴:出題給模型、拿答案和標準答對比、打分。但現在這套玩法要失效了。
AI的身份變了。它早就不是被動的答題機器,而成了會主動做事的行動者。自己規劃行程、調用各種工具、在複雜任務裡連續做判斷——新一代AI正一步步接手原來人類幹的活兒。
跟著來的問題是:既然AI幹的不只是吐出一句話,而是完成整件事情,那還能用「對或錯」的考試標準去評它嗎?
想像一個任務沒有唯一的解法。AI用了個不在預期裡、但效果更好的辦法搞定了。按照傳統評測方式,這叫失敗。但現實是什麼?目標達成了。這不僅是工程細節,更是一個制度難題——你怎麼評估AI,就決定了它是真的學會解決問題,還是只學會討好規則。
所以AI研究圈現在達成了共識:別只看結果,必須看過程。最新的研究和實戰經驗都指向同一個方向——評測不能盯著單一答案,得看整個行動鏈路。AI怎麼理解任務、如何拆解步驟、什麼時候該調工具、能不能根據環境變化調整策略——這些才是真正值得看的。