熟妇激情内射com,性妇wbbbb搡bbbb嗓小说,日本强好片久久久久久aaa,国产精品无码一区二区三区免费

微軟攜手中科院大學(xué)團(tuán)隊(duì)推出CPU驅(qū)動(dòng)AI模型,1位架構(gòu)實(shí)現(xiàn)低能耗運(yùn)行

2025-04-28 11:35  瀏覽:  

微軟研究院與中國科學(xué)院大學(xué)合作團(tuán)隊(duì)近日在arXiv平臺(tái)發(fā)布研究成果,推出全新人工智能模型。該模型突破性地在常規(guī)CPU而非GPU上運(yùn)行,通過創(chuàng)新的數(shù)據(jù)處理架構(gòu)顯著降低能耗,為人工智能技術(shù)落地提供新思路。

傳統(tǒng)GPU驅(qū)動(dòng)模型的能耗困境

當(dāng)前主流大語言模型(LLM)如ChatGPT依賴GPU芯片進(jìn)行訓(xùn)練與推理,此類模型在處理海量數(shù)據(jù)時(shí)需要強(qiáng)大算力支撐,導(dǎo)致能耗問題日益凸顯。數(shù)據(jù)中心為支持聊天機(jī)器人等應(yīng)用消耗大量電力,引發(fā)業(yè)界對(duì)可持續(xù)發(fā)展的擔(dān)憂。研究團(tuán)隊(duì)針對(duì)這一痛點(diǎn)展開技術(shù)攻關(guān),提出更智能的數(shù)據(jù)處理方法。

1位架構(gòu)實(shí)現(xiàn)算力優(yōu)化

新模型摒棄傳統(tǒng)8位或16位浮點(diǎn)數(shù)存儲(chǔ)權(quán)重的方式,轉(zhuǎn)而采用“1位架構(gòu)”。其核心創(chuàng)新在于將模型權(quán)重簡化為-1、0、1三種離散值,使推理過程僅需基礎(chǔ)加減法運(yùn)算。這種設(shè)計(jì)極大降低了內(nèi)存占用與CPU處理負(fù)擔(dān),實(shí)驗(yàn)數(shù)據(jù)顯示該架構(gòu)在保持性能的同時(shí),內(nèi)存需求減少至傳統(tǒng)方案的1/16,能耗降低超90%。研究團(tuán)隊(duì)強(qiáng)調(diào),此方法使普通計(jì)算機(jī)或移動(dòng)設(shè)備即可運(yùn)行高效AI模型,無需依賴專業(yè)GPU硬件。

BitNet b1.58模型與專用運(yùn)行環(huán)境

為適配1位架構(gòu),團(tuán)隊(duì)開發(fā)了配套運(yùn)行時(shí)環(huán)境bitnet.cpp。該系統(tǒng)針對(duì)離散權(quán)重矩陣優(yōu)化內(nèi)存分配與指令調(diào)度,支持20億參數(shù)規(guī)模的模型在單核CPU上穩(wěn)定運(yùn)行。測試結(jié)果表明,新模型在CPU環(huán)境下的推理速度接近傳統(tǒng)GPU方案,且模型精度損失控制在可接受范圍內(nèi)。在MNIST、GLUE等基準(zhǔn)測試中,其性能表現(xiàn)與同類GPU模型相當(dāng),部分場景下甚至實(shí)現(xiàn)超越。

本地化部署提升隱私與能效

該技術(shù)突破為AI應(yīng)用帶來雙重價(jià)值。在隱私保護(hù)層面,用戶數(shù)據(jù)無需上傳云端即可完成處理,支持完全離線的智能助手開發(fā)。研究團(tuán)隊(duì)在樹莓派等邊緣設(shè)備上成功部署聊天機(jī)器人系統(tǒng),響應(yīng)延遲低于300毫秒,且支持?jǐn)嗑W(wǎng)運(yùn)行。在能效層面,單個(gè)推理任務(wù)的耗電量較傳統(tǒng)方案減少92%,單次交互能耗不足0.03Wh。這一特性使其在移動(dòng)終端、物聯(lián)網(wǎng)設(shè)備等場景中具備顯著優(yōu)勢(shì)。

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自合作媒體、機(jī)構(gòu)或其他網(wǎng)站的信息,登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。本網(wǎng)所有信息僅供參考,不做交易和服務(wù)的根據(jù)。本網(wǎng)內(nèi)容如有侵權(quán)或其它問題請(qǐng)及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。
相關(guān)推薦
我國在白天完成地月空間衛(wèi)星激光測距

我國在白天完成地月空間衛(wèi)星激光測距

記者從深空探測實(shí)驗(yàn)室獲悉,4月26日至27日,天都一號(hào)通導(dǎo)技術(shù)試驗(yàn)星成功完成白天強(qiáng)光干擾條件下的地月空間激光測距技術(shù)試驗(yàn),在國際上首次打破地月空間衛(wèi)星激光測距僅能在夜晚作業(yè)的時(shí)間限制,標(biāo)志著我國在深空軌道精密測量領(lǐng)域取得技術(shù)新突破。地月空間衛(wèi)星激光測距,就是用激光測量地球與地月空間衛(wèi)星之間的距離。由于地月空間尺度極大、衛(wèi)星運(yùn)動(dòng)速度極快,對(duì)地月空間衛(wèi)星進(jìn)行激光測距相當(dāng)于在萬米外瞄準(zhǔn)一根頭發(fā)絲,并實(shí)施精密跟蹤與信號(hào)捕獲...
索尼考慮分拆芯片部門

索尼考慮分拆芯片部門

據(jù)知情人士透露,索尼集團(tuán)正考慮最早在今年分拆旗下半導(dǎo)體業(yè)務(wù)并推動(dòng)其獨(dú)立上市。消息人士表示,這家日本科技巨頭在分拆后可能保留索尼半導(dǎo)體解決方案公司的部分股權(quán)。索尼發(fā)言人對(duì)此回應(yīng)稱:"相關(guān)報(bào)道僅為市場猜測,公司目前尚未制定具體計(jì)劃。"近年來,索尼持續(xù)優(yōu)化業(yè)務(wù)結(jié)構(gòu),逐步向娛樂產(chǎn)業(yè)轉(zhuǎn)型,此前已宣布將剝離其金融業(yè)務(wù)部門。分析師指出,若分拆計(jì)劃成行,將有助于索尼進(jìn)一步聚焦核心業(yè)務(wù),同時(shí)為半導(dǎo)體業(yè)務(wù)獲取獨(dú)立發(fā)展空間。目前索尼半導(dǎo)體業(yè)...
研發(fā)成功,腦機(jī)接口領(lǐng)域再添利器

研發(fā)成功,腦機(jī)接口領(lǐng)域再添利器

記者28日從中國科學(xué)院自動(dòng)化研究所獲悉,該所科研團(tuán)隊(duì)成功研發(fā)腦機(jī)接口柔性微電極植入機(jī)器人——CyberSense。這臺(tái)機(jī)器人能像縫紉機(jī)穿針引線一樣,將比頭發(fā)絲還細(xì)的柔性電極精準(zhǔn)植入動(dòng)物大腦,為腦機(jī)接口與腦科學(xué)研究提供關(guān)鍵支撐。柔性腦皮層微電極植入機(jī)器人CyberSense。圖片來源:中國科學(xué)院自動(dòng)化研究所CyberSense具有自動(dòng)化程度高、可植入數(shù)量多、空間定位準(zhǔn)、時(shí)間效率高、使用方便快捷、靈活避讓血管的優(yōu)勢(shì),有效提高了成功率和植入效果...
諾基亞攜手TAWAL展示全球首個(gè)多租戶Open RAN邊緣云平臺(tái)

諾基亞攜手TAWAL展示全球首個(gè)多租戶Open RAN邊緣云平臺(tái)

諾基亞和沙特中立主機(jī)提供商 TAWAL 完成了全球首個(gè)多租戶、可共享的 Open RAN 邊緣云平臺(tái)現(xiàn)場演示,使移動(dòng)運(yùn)營商和大型企業(yè)能夠以比以前低得多的成本推出高性能 5G 服務(wù)。此次展示證明了 TAWAL 如何提供主動(dòng)基礎(chǔ)設(shè)施即服務(wù) (IaaS),同時(shí)運(yùn)營商也能享受顯著的成本節(jié)約,并通過開放的云原生靈活性確保其網(wǎng)絡(luò)面向未來發(fā)展。諾基亞的 anyRAN 架構(gòu)以獨(dú)特的方式,提供了在開放邊緣云上運(yùn)行 anyRAN 工作負(fù)載所需的可靠性能。隨著智慧城市千兆項(xiàng)目...
微軟攜手中科院大學(xué)團(tuán)隊(duì)推出CPU驅(qū)動(dòng)AI模型,1位架構(gòu)實(shí)現(xiàn)低能耗運(yùn)行

微軟攜手中科院大學(xué)團(tuán)隊(duì)推出CPU驅(qū)動(dòng)AI模型,1位架構(gòu)實(shí)現(xiàn)低能耗運(yùn)行

微軟研究院與中國科學(xué)院大學(xué)合作團(tuán)隊(duì)近日在arXiv平臺(tái)發(fā)布研究成果,推出全新人工智能模型。該模型突破性地在常規(guī)CPU而非GPU上運(yùn)行,通過創(chuàng)新的數(shù)據(jù)處理架構(gòu)顯著降低能耗,為人工智能技術(shù)落地提供新思路。傳統(tǒng)GPU驅(qū)動(dòng)模型的能耗困境當(dāng)前主流大語言模型(LLM)如ChatGPT依賴GPU芯片進(jìn)行訓(xùn)練與推理,此類模型在處理海量數(shù)據(jù)時(shí)需要強(qiáng)大算力支撐,導(dǎo)致能耗問題日益凸顯。數(shù)據(jù)中心為支持聊天機(jī)器人等應(yīng)用消耗大量電力,引發(fā)業(yè)界對(duì)可持續(xù)發(fā)展的擔(dān)憂。研...

推薦閱讀

熱文

Copyright © 能源界