熟妇激情内射com,性妇wbbbb搡bbbb嗓小说,日本强好片久久久久久aaa,国产精品无码一区二区三区免费

Qodo推出開源代碼嵌入模型,性能超越OpenAI和Salesforce

2025-03-03 14:31  瀏覽:  

Qodo,前身為Codium,是一家專注于人工智能驅(qū)動(dòng)的代碼質(zhì)量平臺(tái)的公司。近日,該公司發(fā)布了Qodo-Embed-1-1.5B,這是一款開源的代碼嵌入模型,擁有15億個(gè)參數(shù),旨在提升代碼搜索、檢索和理解的能力。該模型在行業(yè)基準(zhǔn)測試中表現(xiàn)優(yōu)異,超越了OpenAI和Salesforce的大型模型,同時(shí)以更小的規(guī)模和更高的效率樹立了新的企業(yè)標(biāo)準(zhǔn)。

對于管理龐大復(fù)雜代碼庫的企業(yè)開發(fā)團(tuán)隊(duì)來說,Qodo-Embed-1-1.5B代表了AI驅(qū)動(dòng)軟件工程工作流程的重大進(jìn)步。通過實(shí)現(xiàn)更準(zhǔn)確、更高效的代碼檢索,該模型解決了AI輔助開發(fā)中的關(guān)鍵挑戰(zhàn)——大型軟件系統(tǒng)中的上下文感知問題。

代碼嵌入模型的重要性

AI驅(qū)動(dòng)的編碼工具傳統(tǒng)上側(cè)重于代碼生成,大型語言模型(LLM)因其編寫新代碼的能力而備受關(guān)注。然而,Qodo的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Itamar Friedman指出:“企業(yè)軟件可能包含數(shù)千萬甚至數(shù)億行代碼。僅僅生成代碼是不夠的,還需要確保代碼質(zhì)量高、功能正常,并與系統(tǒng)的其他部分無縫集成。”

代碼嵌入模型在AI輔助開發(fā)中扮演著關(guān)鍵角色,能夠有效搜索和檢索相關(guān)代碼片段。這對于代碼量龐大、涉及多個(gè)團(tuán)隊(duì)、存儲(chǔ)庫和編程語言的大型組織尤為重要。Friedman強(qiáng)調(diào):“在當(dāng)今的軟件開發(fā)中,上下文至關(guān)重要。要從龐大的代碼庫中獲取正確的上下文,必須依賴高效的搜索機(jī)制。”

Qodo-Embed-1-1.5B的性能與效率

Qodo-Embed-1-1.5B以其高效性和準(zhǔn)確性脫穎而出。盡管許多先進(jìn)模型依賴數(shù)十億個(gè)參數(shù)(如OpenAI的text-embedding-3-large擁有70億個(gè)參數(shù)),Qodo的模型僅用15億個(gè)參數(shù)就實(shí)現(xiàn)了卓越的性能。在代碼信息檢索基準(zhǔn)(CoIR)測試中,Qodo-Embed-1-1.5B得分為70.06,優(yōu)于Salesforce的SFR-Embedding--2_R(67.41)和OpenAI的text-embedding-3-large(65.17)。

這種性能水平對企業(yè)尤為重要,因?yàn)樵撃P湍軌蛟诘统杀綠PU上運(yùn)行,降低了基礎(chǔ)設(shè)施成本,同時(shí)提高了軟件質(zhì)量和開發(fā)效率。

解決代碼復(fù)雜性與細(xì)微差別

AI驅(qū)動(dòng)軟件開發(fā)中的一大挑戰(zhàn)是外觀相似的代碼可能具有截然不同的功能。Friedman舉例說明:“嵌入代碼的最大挑戰(zhàn)之一是,兩個(gè)幾乎相同的函數(shù)(如‘withdraw’和‘deposit’)可能只差一個(gè)加號或減號。它們在向量空間中需要接近,但又必須明顯區(qū)分。”

為了解決這一問題,Qodo開發(fā)了一種獨(dú)特的訓(xùn)練方法,結(jié)合高質(zhì)量的合成數(shù)據(jù)和真實(shí)代碼樣本。通過與Nvidia和AWS的合作,Qodo改進(jìn)了模型訓(xùn)練過程,使其能夠識別功能相似代碼中的細(xì)微差異,確保開發(fā)人員檢索到正確的結(jié)果。

多語言支持與未來擴(kuò)展

Qodo-Embed-1-1.5B已針對10種最常用的編程語言(包括Python、JavaScript和Java)進(jìn)行了優(yōu)化,并支持其他語言和框架。未來,Qodo計(jì)劃進(jìn)一步擴(kuò)展模型功能,提供更深入的企業(yè)開發(fā)工具集成和更多語言支持。

Friedman表示:“許多嵌入模型難以區(qū)分編程語言,有時(shí)會(huì)混淆來自不同語言的代碼片段。我們專門訓(xùn)練了模型以防止這種情況,重點(diǎn)關(guān)注企業(yè)開發(fā)中最常用的10種語言。”

企業(yè)部署與可用性

Qodo通過多種渠道提供其新模型。1.5B參數(shù)版本可在Hugging Face上免費(fèi)獲取,采用OpenRAIL++-M許可證,允許開發(fā)人員自由集成到工作流程中。企業(yè)用戶可選擇商業(yè)許可版本,獲取更多功能。此外,Qodo還提供企業(yè)級平臺(tái),能夠自動(dòng)更新代碼嵌入,確保模型在代碼庫變化時(shí)保持準(zhǔn)確性。

該模型還將通過Nvidia的NIM平臺(tái)和AWS SageMaker JumpStart提供,便于企業(yè)部署和集成到現(xiàn)有開發(fā)環(huán)境中。

AI在企業(yè)軟件開發(fā)中的未來

隨著AI驅(qū)動(dòng)的編碼工具快速發(fā)展,其重點(diǎn)正從代碼生成轉(zhuǎn)向代碼理解、檢索和質(zhì)量保證。Qodo-Embed-1-1.5B等工具將在使AI系統(tǒng)更可靠、高效和經(jīng)濟(jì)高效方面發(fā)揮關(guān)鍵作用。

Friedman總結(jié)道:“對于財(cái)富15,000強(qiáng)企業(yè)的開發(fā)人員來說,AI不僅僅是代碼生成工具。他們的工作流程需要對大型代碼庫有深入理解。高質(zhì)量的代碼嵌入模型正是解決這一需求的關(guān)鍵。”

Qodo的最新模型為企業(yè)在復(fù)雜軟件生態(tài)系統(tǒng)中理解、管理和優(yōu)化代碼提供了高性能的解決方案,標(biāo)志著AI在軟件開發(fā)中的應(yīng)用邁出了重要一步。

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自合作媒體、機(jī)構(gòu)或其他網(wǎng)站的信息,登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。本網(wǎng)所有信息僅供參考,不做交易和服務(wù)的根據(jù)。本網(wǎng)內(nèi)容如有侵權(quán)或其它問題請及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。
相關(guān)推薦
X平臺(tái)新增功能:用戶可通過提及Grok查詢AI解釋

X平臺(tái)新增功能:用戶可通過提及Grok查詢AI解釋

X平臺(tái)正積極擴(kuò)大xAI旗下Grok模型的覆蓋范圍,使用戶能夠更便捷地訪問這一AI工具。近日,許多用戶發(fā)現(xiàn),他們可以通過在回復(fù)中提及Grok并提出問題,來獲取對帖子內(nèi)容的解釋。此前,用戶已可通過側(cè)邊欄按鈕或帖子旁的Grok按鈕訪問Grok功能。Grok利用其圖像理解能力,能夠解釋帖子中的文本和圖像內(nèi)容。這一功能自去年推出以來,已成為X平臺(tái)上AI應(yīng)用的重要部分。過去幾周,AI驅(qū)動(dòng)的搜索引擎Perplexity也在X平臺(tái)上運(yùn)行了一個(gè)自動(dòng)化賬戶,其功能與Grok類似。...
2025年美國人工智能法案數(shù)量已達(dá)781項(xiàng)

2025年美國人工智能法案數(shù)量已達(dá)781項(xiàng)

2025年僅兩個(gè)多月,美國未決人工智能法案已達(dá)781項(xiàng),超過去年743項(xiàng)總數(shù),2023年相關(guān)法案不足200項(xiàng)。咨詢公司多州的跟蹤工具顯示,州級立法活動(dòng)顯著增加,聯(lián)邦層面的監(jiān)管空白。近期法案馬里蘭州的HB 1331,規(guī)范高風(fēng)險(xiǎn)人工智能在重大決策中的開發(fā)和使用;德克薩斯州的《死亡人工智能治理法案》,覆蓋廣泛的人工智能監(jiān)管;馬薩諸塞州的HD 3750,要求醫(yī)療保險(xiǎn)商披露人工智能在保險(xiǎn)指控審查中的應(yīng)用。這些法案標(biāo)志著各州對人工智能快速發(fā)展的不同側(cè)重點(diǎn)。...
SXSW 2025:AI與科技趨勢聚焦

SXSW 2025:AI與科技趨勢聚焦

TechCrunch將參加2025年SXSW大會(huì),這一年度盛會(huì)于周五在奧斯汀開幕,涵蓋科技、音樂、喜劇和電影等多個(gè)領(lǐng)域。今年的焦點(diǎn)無疑是AI,其在全球范圍內(nèi)的影響力在SXSW的日程中得到了充分體現(xiàn)。與往年不同,今年的重點(diǎn)在于如何將AI應(yīng)用于現(xiàn)實(shí)世界,而不僅僅是理論探討。SXSW歷來是科技生態(tài)系統(tǒng)的風(fēng)向標(biāo),反映了創(chuàng)始人和投資者的關(guān)注點(diǎn)。從自動(dòng)駕駛汽車、滑板車熱潮到加密貨幣和迷幻藥,這些趨勢都曾在SXSW上占據(jù)一席之地。今年的科技板塊從周五開始,持續(xù)...
微軟加大AI研發(fā)力度以與OpenAI競爭

微軟加大AI研發(fā)力度以與OpenAI競爭

據(jù)報(bào)道,微軟正在加速開發(fā)其自主AI模型,并探索替代其Copilot機(jī)器人等產(chǎn)品的可能性,以增強(qiáng)與長期合作伙伴OpenAI的競爭能力。據(jù)The Information透露,微軟已開發(fā)出與OpenAI的o1和o3-mini模型相媲美的AI推理模型。OpenAI拒絕向微軟提供有關(guān)o1模型技術(shù)細(xì)節(jié)的請求,進(jìn)一步加劇了兩家公司之間的緊張關(guān)系。彭博社報(bào)道稱,微軟還開發(fā)了一系列名為MAI的模型,這些模型在性能上與OpenAI的模型具有競爭力。微軟計(jì)劃在今年晚些時(shí)候通過API提供這些模型。此...
AI編碼助手Cursor開發(fā)商Anysphere擬以100億美元估值融資

AI編碼助手Cursor開發(fā)商Anysphere擬以100億美元估值融資

隨著AI編碼行業(yè)的迅猛發(fā)展,AI編碼助手Cursor的開發(fā)商Anysphere正在與風(fēng)險(xiǎn)投資家談判,計(jì)劃以近100億美元的估值進(jìn)行新一輪融資。據(jù)彭博社報(bào)道,這一融資計(jì)劃距離Anysphere上一輪1億美元的融資僅過去三個(gè)月,當(dāng)時(shí)其投前估值為25億美元。新一輪融資預(yù)計(jì)將由現(xiàn)有投資者Thrive Capital領(lǐng)投。Anysphere的上一輪融資對其估值為年化經(jīng)常性收入(ARR)的25倍,而根據(jù)《紐約時(shí)報(bào)》的報(bào)道,其ARR已達(dá)到1億美元。目前,Anysphere的ARR可能已攀升至1.5億美元,這...

推薦閱讀

熱文

Copyright © 能源界