Anthropic 發(fā)布 Claude 3.7:全球首款混合推理 AI 模型

2025-02-25 15:11  瀏覽:  

Anthropic 推出最新模型 Claude 3.7,標(biāo)志著人工智能領(lǐng)域的一項(xiàng)突破。這款模型由前 OpenAI 研究人員創(chuàng)立的 Anthropic 開發(fā),被稱為全球首款“混合推理”模型,能夠根據(jù)任務(wù)需求提供即時(shí)響應(yīng)或逐步推理的輸出。AI 平臺(tái)產(chǎn)品負(fù)責(zé)人 Michael Gerstenhaber 表示:“用戶可以靈活控制模型的思考時(shí)長,根據(jù)時(shí)間和預(yù)算調(diào)整推理深度。”新模型還配備“便箋簿”功能,展示推理過程,幫助用戶理解問題解決步驟并優(yōu)化輸入,這一設(shè)計(jì)在中國 DeepSeek 模型中已獲好評。

相比傳統(tǒng)大型語言模型(LLM),Claude 3.7 的獨(dú)特之處在于整合了快速本能反應(yīng)與深思熟慮的推理能力,類似于邁克爾·卡尼曼《思考快與慢》中描述的系統(tǒng) 1 和系統(tǒng) 2 思維。傳統(tǒng) LLM 擅長即時(shí)生成連貫文本,但在需要逐步推理的任務(wù)(如算術(shù)或復(fù)雜規(guī)劃)上表現(xiàn)有限。Anthropic 通過強(qiáng)化學(xué)習(xí)優(yōu)化 Claude 3.7,利用額外人類數(shù)據(jù)訓(xùn)練模型生成準(zhǔn)確答案。研究產(chǎn)品負(fù)責(zé)人 Dianne Penn 指出,模型特別針對業(yè)務(wù)場景進(jìn)行了增強(qiáng),涵蓋代碼編寫與修復(fù)、計(jì)算機(jī)操作及復(fù)雜法律問題處理。她強(qiáng)調(diào):“我們在技術(shù)領(lǐng)域和長時(shí)推理任務(wù)上實(shí)現(xiàn)了改進(jìn),以滿足客戶將模型應(yīng)用于實(shí)戰(zhàn)的需求。”

Claude 3.7 在編碼能力上表現(xiàn)突出,特別是在需要逐步推理的任務(wù)中,超越 OpenAI 的 o1 模型,在 SWE-bench 等基準(zhǔn)測試中取得領(lǐng)先成績。為進(jìn)一步支持開發(fā)者,Anthropic 同步發(fā)布 Claude Code 工具,專為 AI 輔助編碼設(shè)計(jì)。Penn 表示:“模型已具備出色編碼能力,而在處理大型代碼庫等復(fù)雜規(guī)劃場景時(shí),額外推理功能尤為關(guān)鍵。”相比 OpenAI 的 o3 和谷歌的 Gemini Flash Thinking,用戶無需切換模型即可享受靈活推理體驗(yàn)。

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自合作媒體、機(jī)構(gòu)或其他網(wǎng)站的信息,登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。本網(wǎng)所有信息僅供參考,不做交易和服務(wù)的根據(jù)。本網(wǎng)內(nèi)容如有侵權(quán)或其它問題請及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。
相關(guān)推薦
英特爾任命陳立武為CEO

英特爾任命陳立武為CEO

當(dāng)?shù)貢r(shí)間3月12日,英特爾宣布,其董事會(huì)已任命陳立武(Lip-Bu Tan)擔(dān)任首席執(zhí)行官,該任命自3月18日起生效。他將接替臨時(shí)聯(lián)席首席執(zhí)行官大衛(wèi)·津斯納(David Zinsner)和霍爾索斯(Michelle Johnston Holthaus)。陳立武于2024年8月辭去董事會(huì)職務(wù)后,也將重新加入英特爾董事會(huì)。津斯納將繼續(xù)擔(dān)任執(zhí)行副總裁兼首席財(cái)務(wù)官,霍爾特豪斯將繼續(xù)擔(dān)任英特爾產(chǎn)品首席執(zhí)行官。...
X平臺(tái)新增功能:用戶可通過提及Grok查詢AI解釋

X平臺(tái)新增功能:用戶可通過提及Grok查詢AI解釋

X平臺(tái)正積極擴(kuò)大xAI旗下Grok模型的覆蓋范圍,使用戶能夠更便捷地訪問這一AI工具。近日,許多用戶發(fā)現(xiàn),他們可以通過在回復(fù)中提及Grok并提出問題,來獲取對帖子內(nèi)容的解釋。此前,用戶已可通過側(cè)邊欄按鈕或帖子旁的Grok按鈕訪問Grok功能。Grok利用其圖像理解能力,能夠解釋帖子中的文本和圖像內(nèi)容。這一功能自去年推出以來,已成為X平臺(tái)上AI應(yīng)用的重要部分。過去幾周,AI驅(qū)動(dòng)的搜索引擎Perplexity也在X平臺(tái)上運(yùn)行了一個(gè)自動(dòng)化賬戶,其功能與Grok類似。...
2025年美國人工智能法案數(shù)量已達(dá)781項(xiàng)

2025年美國人工智能法案數(shù)量已達(dá)781項(xiàng)

2025年僅兩個(gè)多月,美國未決人工智能法案已達(dá)781項(xiàng),超過去年743項(xiàng)總數(shù),2023年相關(guān)法案不足200項(xiàng)。咨詢公司多州的跟蹤工具顯示,州級立法活動(dòng)顯著增加,聯(lián)邦層面的監(jiān)管空白。近期法案馬里蘭州的HB 1331,規(guī)范高風(fēng)險(xiǎn)人工智能在重大決策中的開發(fā)和使用;德克薩斯州的《死亡人工智能治理法案》,覆蓋廣泛的人工智能監(jiān)管;馬薩諸塞州的HD 3750,要求醫(yī)療保險(xiǎn)商披露人工智能在保險(xiǎn)指控審查中的應(yīng)用。這些法案標(biāo)志著各州對人工智能快速發(fā)展的不同側(cè)重點(diǎn)。...
SXSW 2025:AI與科技趨勢聚焦

SXSW 2025:AI與科技趨勢聚焦

TechCrunch將參加2025年SXSW大會(huì),這一年度盛會(huì)于周五在奧斯汀開幕,涵蓋科技、音樂、喜劇和電影等多個(gè)領(lǐng)域。今年的焦點(diǎn)無疑是AI,其在全球范圍內(nèi)的影響力在SXSW的日程中得到了充分體現(xiàn)。與往年不同,今年的重點(diǎn)在于如何將AI應(yīng)用于現(xiàn)實(shí)世界,而不僅僅是理論探討。SXSW歷來是科技生態(tài)系統(tǒng)的風(fēng)向標(biāo),反映了創(chuàng)始人和投資者的關(guān)注點(diǎn)。從自動(dòng)駕駛汽車、滑板車熱潮到加密貨幣和迷幻藥,這些趨勢都曾在SXSW上占據(jù)一席之地。今年的科技板塊從周五開始,持續(xù)...
微軟加大AI研發(fā)力度以與OpenAI競爭

微軟加大AI研發(fā)力度以與OpenAI競爭

據(jù)報(bào)道,微軟正在加速開發(fā)其自主AI模型,并探索替代其Copilot機(jī)器人等產(chǎn)品的可能性,以增強(qiáng)與長期合作伙伴OpenAI的競爭能力。據(jù)The Information透露,微軟已開發(fā)出與OpenAI的o1和o3-mini模型相媲美的AI推理模型。OpenAI拒絕向微軟提供有關(guān)o1模型技術(shù)細(xì)節(jié)的請求,進(jìn)一步加劇了兩家公司之間的緊張關(guān)系。彭博社報(bào)道稱,微軟還開發(fā)了一系列名為MAI的模型,這些模型在性能上與OpenAI的模型具有競爭力。微軟計(jì)劃在今年晚些時(shí)候通過API提供這些模型。此...

推薦閱讀

熱文

Copyright © 能源界