天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

Mistral新品CodeStral 2501登顶,代码模型能力再升级,上下文窗口达256k

2025-01-14来源:天脉网编辑:瑞雪

在AI编程领域,一款备受瞩目的代码模型CodeStral再次迎来重大更新,此次升级使其与DeepSeek V2.5和Claude 3.5并驾齐驱,共同荣登Copilot竞技场榜首。

此次发布的CodeStral 2501版本,不仅在性能上实现了飞跃,其上下文窗口也大幅扩展至256k,是前一代的8倍之多。这一改进意味着模型能够处理更加复杂和长远的代码上下文,为开发者提供更加精准的代码补全和生成建议。

据Mistral团队介绍,CodeStral 2501采用了更高效的架构和分词器,使得生成速度相较于前一代提升了约2倍。这一显著的性能提升,无疑将极大地提升开发者的编码效率。

在多个基准测试中,CodeStral 2501均取得了SOTA(State-Of-The-Art,即当前最优)的成绩,特别是在代码补全(FIM)能力方面表现突出。Continue.dev的联合创始人Ty Dunn更是高度评价了CodeStral 2501,认为它标志着FIM领域的一次重大进步。

在Copilot竞技场上,CodeStral 2501以并列第一的身份傲视群雄,其得分相较于前一代版本提高了12分,增幅达到1.2%。紧随其后的是CodeStral的上一版本2405,而Llama 3.1、Gemini 1.5 Pro和GPT-4o等模型则位列其后。尽管榜单中没有o1的身影,但其加入或许将改变当前的竞争格局。

Copilot竞技场排名

Copilot竞技场由卡内基梅隆大学和UC伯克利的研究人员与LMArena合作推出,旨在通过用户出题和模型匿名输出的方式,评估代码模型的性能。这一平台可以看作是LLM竞技场的代码专用版本,同时也是一款开源编程工具,支持在VSCode中同时运行多个模型,方便用户进行比较和选择。

Copilot竞技场PK次数

在Humaneval等传统测试中,CodeStral 2501同样取得了SOTA的成绩。在Python语言和SQL数据库测试中,CodeStral 2501在多个测试指标上均位列第一,展现出强大的跨语言处理能力。CodeStral还支持80多种编程语言,并在多种常用语言中均取得了SOTA的成绩。

尽管CodeStral 2501在Java上的成绩相较于前一代有所下降,但在FIM表现(单行精确匹配)方面,其平均成绩以及Python、Java和JS三个单项均取得了显著进步,并优于OpenAI FIM API等其他模型。这一成绩再次证明了CodeStral 2501在代码生成和补全方面的强大实力。

目前,CodeStral 2501已经可以通过Mistral的合作方Continue在VSCode或Jetbrains系列IDE中使用。对于动手能力强的用户,也可以通过API自行部署,价格实惠且灵活。这一代码模型的推出,无疑将为开发者提供更加高效和智能的编程体验。

《流星群侠传》手游2025年3月24日后将停止更新,玩家何去何从?
网易旗下动作武侠手游《流星群侠传》今日发布官方公告,宣布因游戏开发运营策略调整,游戏将于2025年3月24日15时起停止新内容开发并关闭部分服务器。具体安排如下:2025年1月22日14时起,游戏将关闭下载入…

2025-01-23

腾讯游戏新动向:与抖音深度联姻,能否延续长青传奇?
以腾讯多款2024年发行的新游来看,今年1月,背靠IP的《极品飞车:集结》与二次元新游《白荆回廊》在畅销榜的排名都在百名开外,而上半年一度在营销上“碰瓷”《魔兽世界》的MMO《塔瑞斯世界》已不在畅销榜内——…

2025-01-23

世嘉推出“SEGA Account”,玩家抢先获取游戏资讯,特典福利等你来领!
世嘉官方宣布,自1月22日起正式开放“SEGA Account”服务,接受用户注册。注册后,玩家将第一时间获知世嘉及ATLUS出品的游戏、促销和各类线上线下活动的最新资讯。此外,官方表示今后还会不定期赠送游戏…

2025-01-23