訂閱
糾錯(cuò)
加入自媒體

Cursor 2.0 發(fā)布:首個(gè)編程大模型來了!30 秒完成復(fù)雜任務(wù)

昨日,Cursor 發(fā)布兩項(xiàng)重大更新:

  1. 首個(gè)編碼模型 Composer

  2. 用于并行協(xié)作多個(gè)代理的新界面

官方表示,Composer 是一種前沿的編碼模型,可在 30 秒內(nèi)完成任務(wù)。它可以在不同模型上運(yùn)行相同的提示,以實(shí)現(xiàn)最大程度的智能。

借助內(nèi)置瀏覽器,代理商現(xiàn)在可以運(yùn)行和測試代碼,并可以使用語音模式將語音轉(zhuǎn)換為代碼。

全新 Composer

Composer 是一款前沿模型,速度是同等智能模型的 4 倍。

該模型專為在 Cursor 中進(jìn)行低延遲的代理式編碼而打造,大多數(shù)回合在 30 秒內(nèi)完成。

Composer 通過一組強(qiáng)大的工具進(jìn)行訓(xùn)練,包括覆蓋整個(gè)代碼庫的語義搜索,因此在理解與處理大型代碼庫方面顯著更強(qiáng)。

Cursor 沿用了在開發(fā) Cursor Tab 時(shí)的經(jīng)驗(yàn)。在研發(fā)過程中,研究人員試驗(yàn)了一個(gè)代號(hào)為 Cheetah 的原型代理模型,Composer 是該模型的更智能升級(jí)版,憑借足夠的速度支撐交互式體驗(yàn),讓編碼更順暢。

Composer 是一種專家混合(MoE)語言模型,支持長上下文的生成與理解。它通過在多樣化的開發(fā)環(huán)境中進(jìn)行強(qiáng)化學(xué)習(xí)(RL),對(duì)軟件工程進(jìn)行了專項(xiàng)優(yōu)化。

在 RL 過程中,模型會(huì)自發(fā)習(xí)得一些有用的能力,例如執(zhí)行復(fù)雜搜索、修復(fù)錯(cuò)誤,以及編寫并運(yùn)行單元測試。

通過將 MXFP8 MoE kernels 與專家并行和混合分片數(shù)據(jù)并行相結(jié)合,在原生低精度下訓(xùn)練模型,模型能夠以極低的通信開銷將訓(xùn)練擴(kuò)展到數(shù)千張 NVIDIA GPU。

為了承載強(qiáng)化學(xué)習(xí)工作負(fù)載,研究人員對(duì)既有的 Background Agents 基礎(chǔ)設(shè)施進(jìn)行了改造,重寫了虛擬機(jī)調(diào)度器,以適配訓(xùn)練運(yùn)行的突發(fā)性與規(guī)模。

為衡量進(jìn)展,研究團(tuán)隊(duì)還構(gòu)建了一套盡可能貼近軟件開發(fā)者實(shí)際使用價(jià)值的評(píng)測。該評(píng)測不僅考察代理的正確性,還評(píng)估其對(duì)代碼庫既有抽象與軟件工程實(shí)踐的遵循程度。

多代理界面

新的界面更聚焦,是 Cursor 團(tuán)隊(duì)自下而上圍繞代理而非文件進(jìn)行設(shè)計(jì)的。細(xì)節(jié)由代理處理,需要深入代碼時(shí),仍可在新布局中輕松打開文件,或切換回經(jīng)典 IDE。

底層由 git worktree 或遠(yuǎn)程機(jī)器提供支持,Cursor 2.0 能夠并行運(yùn)行多個(gè)代理,且彼此互不干擾。多個(gè)模型甚至可以同時(shí)嘗試同一問題并擇優(yōu)采用,能顯著提升最終結(jié)果,尤其是在更難的任務(wù)上。

但同時(shí),兩個(gè)新的瓶頸也相繼出現(xiàn):代碼評(píng)審與變更測試。

為解決這兩個(gè)瓶頸,團(tuán)隊(duì)構(gòu)建了原生瀏覽器工具,使 Cursor 可以測試其工作并持續(xù)迭代,直到產(chǎn)出正確的最終結(jié)果。

官方表示,推動(dòng) Composer 開發(fā)的初衷之一是打造一個(gè)在日常工作中也會(huì)主動(dòng)依賴的智能體。現(xiàn)在 Composer 已被多次在日常軟件開發(fā)中使用。

參考資料:

https://cursor.com/cn/blog/2-0

https://cursor.com/cn/blog/composer

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)。刊用本站稿件,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)