伊人99,里中结衣潮喷少妇无码

Qodo推出開源代碼嵌入模型，性能超越OpenAI和Salesforce

2025-03-03 14:31 瀏覽：

Qodo，前身為Codium，是一家專注于人工智能驅(qū)動(dòng)的代碼質(zhì)量平臺(tái)的公司。近日，該公司發(fā)布了Qodo-Embed-1-1.5B，這是一款開源的代碼嵌入模型，擁有15億個(gè)參數(shù)，旨在提升代碼搜索、檢索和理解的能力。該模型在行業(yè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，超越了OpenAI和Salesforce的大型模型，同時(shí)以更小的規(guī)模和更高的效率樹立了新的企業(yè)標(biāo)準(zhǔn)。

對(duì)于管理龐大復(fù)雜代碼庫(kù)的企業(yè)開發(fā)團(tuán)隊(duì)來(lái)說(shuō)，Qodo-Embed-1-1.5B代表了AI驅(qū)動(dòng)軟件工程工作流程的重大進(jìn)步。通過(guò)實(shí)現(xiàn)更準(zhǔn)確、更高效的代碼檢索，該模型解決了AI輔助開發(fā)中的關(guān)鍵挑戰(zhàn)——大型軟件系統(tǒng)中的上下文感知問(wèn)題。

代碼嵌入模型的重要性

AI驅(qū)動(dòng)的編碼工具傳統(tǒng)上側(cè)重于代碼生成，大型語(yǔ)言模型(LLM)因其編寫新代碼的能力而備受關(guān)注。然而，Qodo的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Itamar Friedman指出：“企業(yè)軟件可能包含數(shù)千萬(wàn)甚至數(shù)億行代碼。僅僅生成代碼是不夠的，還需要確保代碼質(zhì)量高、功能正常，并與系統(tǒng)的其他部分無(wú)縫集成。”

代碼嵌入模型在AI輔助開發(fā)中扮演著關(guān)鍵角色，能夠有效搜索和檢索相關(guān)代碼片段。這對(duì)于代碼量龐大、涉及多個(gè)團(tuán)隊(duì)、存儲(chǔ)庫(kù)和編程語(yǔ)言的大型組織尤為重要。Friedman強(qiáng)調(diào)：“在當(dāng)今的軟件開發(fā)中，上下文至關(guān)重要。要從龐大的代碼庫(kù)中獲取正確的上下文，必須依賴高效的搜索機(jī)制。”

Qodo-Embed-1-1.5B的性能與效率

Qodo-Embed-1-1.5B以其高效性和準(zhǔn)確性脫穎而出。盡管許多先進(jìn)模型依賴數(shù)十億個(gè)參數(shù)(如OpenAI的text-embedding-3-large擁有70億個(gè)參數(shù))，Qodo的模型僅用15億個(gè)參數(shù)就實(shí)現(xiàn)了卓越的性能。在代碼信息檢索基準(zhǔn)(CoIR)測(cè)試中，Qodo-Embed-1-1.5B得分為70.06，優(yōu)于Salesforce的SFR-Embedding--2_R(67.41)和OpenAI的text-embedding-3-large(65.17)。

這種性能水平對(duì)企業(yè)尤為重要，因?yàn)樵撃Ｐ湍軌蛟诘统杀綠PU上運(yùn)行，降低了基礎(chǔ)設(shè)施成本，同時(shí)提高了軟件質(zhì)量和開發(fā)效率。

解決代碼復(fù)雜性與細(xì)微差別

AI驅(qū)動(dòng)軟件開發(fā)中的一大挑戰(zhàn)是外觀相似的代碼可能具有截然不同的功能。Friedman舉例說(shuō)明：“嵌入代碼的最大挑戰(zhàn)之一是，兩個(gè)幾乎相同的函數(shù)(如‘withdraw’和‘deposit’)可能只差一個(gè)加號(hào)或減號(hào)。它們?cè)谙蛄靠臻g中需要接近，但又必須明顯區(qū)分。”

為了解決這一問(wèn)題，Qodo開發(fā)了一種獨(dú)特的訓(xùn)練方法，結(jié)合高質(zhì)量的合成數(shù)據(jù)和真實(shí)代碼樣本。通過(guò)與Nvidia和AWS的合作，Qodo改進(jìn)了模型訓(xùn)練過(guò)程，使其能夠識(shí)別功能相似代碼中的細(xì)微差異，確保開發(fā)人員檢索到正確的結(jié)果。

多語(yǔ)言支持與未來(lái)擴(kuò)展

Qodo-Embed-1-1.5B已針對(duì)10種最常用的編程語(yǔ)言(包括Python、JavaScript和Java)進(jìn)行了優(yōu)化，并支持其他語(yǔ)言和框架。未來(lái)，Qodo計(jì)劃進(jìn)一步擴(kuò)展模型功能，提供更深入的企業(yè)開發(fā)工具集成和更多語(yǔ)言支持。

Friedman表示：“許多嵌入模型難以區(qū)分編程語(yǔ)言，有時(shí)會(huì)混淆來(lái)自不同語(yǔ)言的代碼片段。我們專門訓(xùn)練了模型以防止這種情況，重點(diǎn)關(guān)注企業(yè)開發(fā)中最常用的10種語(yǔ)言。”

企業(yè)部署與可用性

Qodo通過(guò)多種渠道提供其新模型。1.5B參數(shù)版本可在Hugging Face上免費(fèi)獲取，采用OpenRAIL++-M許可證，允許開發(fā)人員自由集成到工作流程中。企業(yè)用戶可選擇商業(yè)許可版本，獲取更多功能。此外，Qodo還提供企業(yè)級(jí)平臺(tái)，能夠自動(dòng)更新代碼嵌入，確保模型在代碼庫(kù)變化時(shí)保持準(zhǔn)確性。

該模型還將通過(guò)Nvidia的NIM平臺(tái)和AWS SageMaker JumpStart提供，便于企業(yè)部署和集成到現(xiàn)有開發(fā)環(huán)境中。

AI在企業(yè)軟件開發(fā)中的未來(lái)

隨著AI驅(qū)動(dòng)的編碼工具快速發(fā)展，其重點(diǎn)正從代碼生成轉(zhuǎn)向代碼理解、檢索和質(zhì)量保證。Qodo-Embed-1-1.5B等工具將在使AI系統(tǒng)更可靠、高效和經(jīng)濟(jì)高效方面發(fā)揮關(guān)鍵作用。

Friedman總結(jié)道：“對(duì)于財(cái)富15,000強(qiáng)企業(yè)的開發(fā)人員來(lái)說(shuō)，AI不僅僅是代碼生成工具。他們的工作流程需要對(duì)大型代碼庫(kù)有深入理解。高質(zhì)量的代碼嵌入模型正是解決這一需求的關(guān)鍵。”

Qodo的最新模型為企業(yè)在復(fù)雜軟件生態(tài)系統(tǒng)中理解、管理和優(yōu)化代碼提供了高性能的解決方案，標(biāo)志著AI在軟件開發(fā)中的應(yīng)用邁出了重要一步。

Qodo推出開源代碼嵌入模型，性能超越OpenAI和Salesforce

英飛凌在印度開設(shè)研發(fā)中心

英偉達(dá)攜手聯(lián)發(fā)科發(fā)力ASIC市場(chǎng)，打造NVLink IP、長(zhǎng)距離224G Serdes

繼芯片與人工智能后，美國(guó)或考慮推出機(jī)器人國(guó)家戰(zhàn)略

庫(kù)克重申：加大在華投資規(guī)模

中國(guó)自主研發(fā)12英寸碳化硅襯底全自動(dòng)激光切割技術(shù)

國(guó)際招標(biāo) 更多>

推薦閱讀

熱文

Qodo推出開源代碼嵌入模型，性能超越OpenAI和Salesforce

英飛凌在印度開設(shè)研發(fā)中心

英偉達(dá)攜手聯(lián)發(fā)科發(fā)力ASIC市場(chǎng)，打造NVLink IP、長(zhǎng)距離224G Serdes

繼芯片與人工智能后，美國(guó)或考慮推出機(jī)器人國(guó)家戰(zhàn)略

庫(kù)克重申：加大在華投資規(guī)模

中國(guó)自主研發(fā)12英寸碳化硅襯底全自動(dòng)激光切割技術(shù)

國(guó)際招標(biāo) 更多>

推薦閱讀

熱文

英偉達(dá)攜手聯(lián)發(fā)科發(fā)力ASIC市場(chǎng)，打造NVLink IP、長(zhǎng)距離224G Serdes

繼芯片與人工智能后，美國(guó)或考慮推出機(jī)器人國(guó)家戰(zhàn)略