微軟攜手中科院大學(xué)團(tuán)隊推出CPU驅(qū)動AI模型,1位架構(gòu)實現(xiàn)低能耗運(yùn)行

2025-04-28 11:35  瀏覽:  

微軟研究院與中國科學(xué)院大學(xué)合作團(tuán)隊近日在arXiv平臺發(fā)布研究成果,推出全新人工智能模型。該模型突破性地在常規(guī)CPU而非GPU上運(yùn)行,通過創(chuàng)新的數(shù)據(jù)處理架構(gòu)顯著降低能耗,為人工智能技術(shù)落地提供新思路。

傳統(tǒng)GPU驅(qū)動模型的能耗困境

當(dāng)前主流大語言模型(LLM)如ChatGPT依賴GPU芯片進(jìn)行訓(xùn)練與推理,此類模型在處理海量數(shù)據(jù)時需要強(qiáng)大算力支撐,導(dǎo)致能耗問題日益凸顯。數(shù)據(jù)中心為支持聊天機(jī)器人等應(yīng)用消耗大量電力,引發(fā)業(yè)界對可持續(xù)發(fā)展的擔(dān)憂。研究團(tuán)隊針對這一痛點展開技術(shù)攻關(guān),提出更智能的數(shù)據(jù)處理方法。

1位架構(gòu)實現(xiàn)算力優(yōu)化

新模型摒棄傳統(tǒng)8位或16位浮點數(shù)存儲權(quán)重的方式,轉(zhuǎn)而采用“1位架構(gòu)”。其核心創(chuàng)新在于將模型權(quán)重簡化為-1、0、1三種離散值,使推理過程僅需基礎(chǔ)加減法運(yùn)算。這種設(shè)計極大降低了內(nèi)存占用與CPU處理負(fù)擔(dān),實驗數(shù)據(jù)顯示該架構(gòu)在保持性能的同時,內(nèi)存需求減少至傳統(tǒng)方案的1/16,能耗降低超90%。研究團(tuán)隊強(qiáng)調(diào),此方法使普通計算機(jī)或移動設(shè)備即可運(yùn)行高效AI模型,無需依賴專業(yè)GPU硬件。

BitNet b1.58模型與專用運(yùn)行環(huán)境

為適配1位架構(gòu),團(tuán)隊開發(fā)了配套運(yùn)行時環(huán)境bitnet.cpp。該系統(tǒng)針對離散權(quán)重矩陣優(yōu)化內(nèi)存分配與指令調(diào)度,支持20億參數(shù)規(guī)模的模型在單核CPU上穩(wěn)定運(yùn)行。測試結(jié)果表明,新模型在CPU環(huán)境下的推理速度接近傳統(tǒng)GPU方案,且模型精度損失控制在可接受范圍內(nèi)。在MNIST、GLUE等基準(zhǔn)測試中,其性能表現(xiàn)與同類GPU模型相當(dāng),部分場景下甚至實現(xiàn)超越。

本地化部署提升隱私與能效

該技術(shù)突破為AI應(yīng)用帶來雙重價值。在隱私保護(hù)層面,用戶數(shù)據(jù)無需上傳云端即可完成處理,支持完全離線的智能助手開發(fā)。研究團(tuán)隊在樹莓派等邊緣設(shè)備上成功部署聊天機(jī)器人系統(tǒng),響應(yīng)延遲低于300毫秒,且支持?jǐn)嗑W(wǎng)運(yùn)行。在能效層面,單個推理任務(wù)的耗電量較傳統(tǒng)方案減少92%,單次交互能耗不足0.03Wh。這一特性使其在移動終端、物聯(lián)網(wǎng)設(shè)備等場景中具備顯著優(yōu)勢。

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自合作媒體、機(jī)構(gòu)或其他網(wǎng)站的信息,登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內(nèi)容的真實性。本網(wǎng)所有信息僅供參考,不做交易和服務(wù)的根據(jù)。本網(wǎng)內(nèi)容如有侵權(quán)或其它問題請及時告之,本網(wǎng)將及時修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。
相關(guān)推薦
英特爾1.8nm制程細(xì)節(jié)曝光

英特爾1.8nm制程細(xì)節(jié)曝光

英特爾在2025年VLSI研討會上披露了更多關(guān)于其最新的Intel 18A(1.8nm)制程的細(xì)節(jié)。最新資料顯示,Intel 18A提供了高性能(HP)和高密度(HD)庫,具有全功能的技術(shù)設(shè)計功能和增強(qiáng)的設(shè)計易用性。在PPA(性能、功耗、面積)比較中,Intel 18A在標(biāo)準(zhǔn)Arm核心架構(gòu)的芯片上,1.1V電壓下實現(xiàn)了25%的速度提升和36%的功耗降低。此外,Intel 18A的面積利用率比Intel 3更高,這意味著該制程可以實現(xiàn)更好的面積效率和更高密度設(shè)計的潛力。英特爾官網(wǎng)此前公布的資料...
馬來西亞航空考慮購買中國商飛飛機(jī)

馬來西亞航空考慮購買中國商飛飛機(jī)

馬來西亞航空正在考慮購買中國國產(chǎn)飛機(jī),中國商飛的三款商用飛機(jī)C909、C919和C929都在評估范圍內(nèi)。中國國家主席習(xí)近平對馬來西亞進(jìn)行訪問后,兩國于4月17日發(fā)布聯(lián)合聲明,其中提到支持馬來西亞的航空公司引進(jìn)和運(yùn)營中國商用飛機(jī)。據(jù)悉,聲明中所指的中國商用飛機(jī),主要指的是中國商飛公司(COMAC)生產(chǎn)的C909和C919飛機(jī)。目前,C909支線客機(jī)已進(jìn)入印尼、越南和老撾等東南亞國家;C919干線客機(jī)則在中國三大航空公司服務(wù)國內(nèi)市場,預(yù)計最快2026年在海...
臺積電美國第三晶圓廠動工

臺積電美國第三晶圓廠動工

4月30日消息,據(jù)報道,臺積電美國子公司 TSMC Arizona 的第三晶圓廠當(dāng)日舉行了破土動工儀式。該晶圓廠完工后將提供 N2、A16 先進(jìn)制程的產(chǎn)能。TSMC Arizona 第三晶圓廠是臺積電在美第一階段 650 億美元投資的最后一個建設(shè)項目,而在 1000 億美元的第二階段投資中,臺積電還將在亞利桑那建設(shè)另外三座晶圓廠。臺積電董事長暨總裁魏哲家此前曾表示,2nm 將成為 TSMC Arizona 的主要節(jié)點,六座晶圓廠全部建成投產(chǎn)后將貢獻(xiàn)該企業(yè)全部 2nm 及以下先進(jìn)...
馬斯克旗下xAI正洽談融資200億美元,將成為史上第二大初創(chuàng)企業(yè)融資

馬斯克旗下xAI正洽談融資200億美元,將成為史上第二大初創(chuàng)企業(yè)融資

馬斯克旗下的人工智能公司xAI控股近期傳出重磅消息——公司正與投資者洽談新一輪融資,目標(biāo)金額約200億美元。若交易達(dá)成,xAI的估值或?qū)⑼黄?200億美元,成為僅次于OpenAI(估值400億美元)的全球第二大私營科技融資案例。此次融資的核心背景是xAI與社交媒體平臺X(原Twitter)的深度整合。今年3月,xAI通過全股票交易完成對X平臺的收購,合并后新公司估值達(dá)800億美元。馬斯克曾公開表示,xAI與X的協(xié)同效應(yīng)將釋放人工智能與社交媒體的巨大潛力,例如...
我國在白天完成地月空間衛(wèi)星激光測距

我國在白天完成地月空間衛(wèi)星激光測距

記者從深空探測實驗室獲悉,4月26日至27日,天都一號通導(dǎo)技術(shù)試驗星成功完成白天強(qiáng)光干擾條件下的地月空間激光測距技術(shù)試驗,在國際上首次打破地月空間衛(wèi)星激光測距僅能在夜晚作業(yè)的時間限制,標(biāo)志著我國在深空軌道精密測量領(lǐng)域取得技術(shù)新突破。地月空間衛(wèi)星激光測距,就是用激光測量地球與地月空間衛(wèi)星之間的距離。由于地月空間尺度極大、衛(wèi)星運(yùn)動速度極快,對地月空間衛(wèi)星進(jìn)行激光測距相當(dāng)于在萬米外瞄準(zhǔn)一根頭發(fā)絲,并實施精密跟蹤與信號捕獲...

推薦閱讀

熱文

Copyright © 能源界