6月17日消息,月之源月之暗面推出了針對(duì)軟件工程任務(wù)的暗面全新開(kāi)源代碼大模型——Kimi-Dev-72B。
該模型在SWE-bench Verified編程基準(zhǔn)測(cè)試中取得了全球最高開(kāi)源模型水平,放王以僅72B的炸開(kāi)參數(shù)量,超越了剛發(fā)布不就、模型參數(shù)量達(dá)671B的超新新版DeepSeek-R1。
該模型通過(guò)大規(guī)模強(qiáng)化學(xué)習(xí)進(jìn)行優(yōu)化,全球能夠自主修補(bǔ)Docker中的月之源真實(shí)存儲(chǔ)庫(kù),并且只有當(dāng)整個(gè)測(cè)試套件通過(guò)時(shí)才會(huì)獲得獎(jiǎng)勵(lì),暗面從而確保了解決方案的放王正確性和穩(wěn)健性。
Kimi-Dev-72B的炸開(kāi)設(shè)計(jì)理念和技術(shù)細(xì)節(jié)包括BugFixer和TestWriter的組合、中期訓(xùn)練、模型強(qiáng)化學(xué)習(xí)和測(cè)試時(shí)自我博弈。超新
其中,全球BugFixer和TestWriter的月之源互補(bǔ)設(shè)計(jì)奠定了模型的基礎(chǔ),使其在修復(fù)錯(cuò)誤和編寫(xiě)測(cè)試方面表現(xiàn)出色。
中期訓(xùn)練則通過(guò)約1500億個(gè)高質(zhì)量的真實(shí)數(shù)據(jù),增強(qiáng)了模型對(duì)實(shí)際Bug修復(fù)和單元測(cè)試的理解。
強(qiáng)化學(xué)習(xí)階段則專(zhuān)注于提升其代碼編輯能力,使其在文件本地化和代碼編輯方面表現(xiàn)出色。
目前,Kimi-Dev-72B已在Hugging Face和GitHub上提供下載和部署,包括模型權(quán)重、源代碼等。
可能永遠(yuǎn)見(jiàn)不到!Intel發(fā)燒級(jí)Nova Lake
莆田:保護(hù)歷史遺存新縣鎮(zhèn)白云村桃源書(shū)院重修竣工
官方通報(bào)男子跳至兵馬俑三號(hào)坑:造成二級(jí)文物兩尊鎧甲武士俑損壞
河北:17億!新中標(biāo)2個(gè)大項(xiàng)目
《消逝的光芒:困獸》8月22日發(fā)售!試玩預(yù)告片首曝
中建集團(tuán)深入實(shí)施“一六六”戰(zhàn)略路徑,塑強(qiáng)房建首位優(yōu)勢(shì)。近日,...
2025-07-186直播吧6月1日訊 據(jù)知名記者羅馬諾報(bào)道,勒沃庫(kù)森引進(jìn)布倫特福...
2025-07-184