法国人工智能初创企业Mistral AI推出全新模型Devstral 2,以此涉足专业编码领域,该模型是专门为应对高级编码任务而开发的。
今天发布的Devstral 2是一款参数达1230亿的模型,配备了自主软件工程能力,公司称其可与顶级专有vie编码系统媲美,同时成本降低近85%。
Devstral 2 将和 Mistral Vibe 一同推出,Mistral Vibe 是全新的命令行界面,能让开发者调用模型,借助自然语言提示完成复杂任务。另外还有一款更轻量的模型 Devstral Small 2,参数只有240亿个,专门针对本地部署做了优化。
Mistral AI 正试图为 Google LLC 和 OpenAI 等公司提供的专有编码机器人提供替代方案,这些机器人试图将用户锁定在生态系统中,从而定位自己为真正的开源氛围编码平台。
Mistral Vibe CLI 是核心交互界面,依托底层 Devstral 模型,能把用户的自然语言指令转化为实际的代码修改。该系统功能完备,并非仅生成代码片段,而是专注于在整个代码库中进行探索、修改与创建变更。它既可以在各类第三方集成开发环境中使用,也能作为独立终端工具运行,搭配的工具集让模型可自主完成文件编辑、代码库搜索、版本控制管理及 shell 命令执行等操作。
Mistral AI 表示,Devstral 2 能够扫描文件结构和 Git 状态,这意味着它拥有“项目感知上下文”,可以在整个项目中更新依赖或修改代码库,而不会丢失对当前作的跟踪。
Mistral AI指出,Devstral 2的核心目标是提升运营效率。该模型融合了1230亿参数的密集变换器架构与256,000令牌的上下文窗口,在SWE-bench基准测试中斩获72.2%的亮眼成绩,成功跻身行业顶尖编码模型阵营。在无重复模型的竞争格局中,仅有DeepSeek V3.2的得分略胜一筹;此外,谷歌、OpenAI以及Anthropic PBC的前沿模型排名也更为靠前。
Devstral Small 2 版本虽然体积不大,但性能表现十分出色,在同一项基准测试中获得了68%的评分,这表明它足以和体积为其五倍的车型一较高下。这一点相当令人惊叹,由于该型号具备轻量化的特性,能够在标准笔记本电脑这类消费级硬件上高效运转,从而避免了云端AI运行时产生的延迟问题。
开配重与成本优势
不过,Mistral AI指出,Devstral 2最突出的优势体现在成本方面——该模型的应用程序接口定价为每百万输入代币40美分,每百万输出代币2美元,这一价格约为Anthropic的Claude Sonnet 3.5等模型的七分之一。
Devstral 2与Devstral Small 2最直观的差异在于尺寸大小,不过Mistral AI为这两款模型制定了不同的授权条款。Devstral 2采用的是修改后的MIT许可证,这表明用户需遵守基于收入的特定限制;而Devstral Small 2则使用更为宽松的Apache 2.0许可证,意味着其使用不受限制。正因如此,开发者能够按照自身需求修改这款较小的模型并进行集成,无需担心专有系统带来的法律困扰。
很容易想象,一些使用 Devstral 2 的企业选择混合工作流程,使用重的 1230 亿参数模型处理复杂的架构规划任务,而较小的 240 亿参数版本则用于更快速、私有的代码变更,且这些修改仍属于其网络边界内。
Mistral AI 推出 Devstral 2 之时,编码领域的竞争氛围正愈发浓烈,不过它采用的开放权重策略说不定能赢得关注。其他竞争者持续在锁定开发者方面发力,谷歌新近宣布与 Replit Inc. 达成合作便是典型例子,把强大的模型、IDE 和云计算整合打包成了一个整体方案。
谷歌的Gemini 3 Pro与该公司新推出的AntiGravity IDE实现了紧密集成,这一举措似乎旨在将开发者牢牢纳入其生态系统;而Anthropic在收购JavaScript工具包Bun后,据称正着手为自家编码代理打造专用运行时。