实测下来,KimiK2.5是目前最贴近Gemini3Pro的国产开源模型

发布时间:2026-02-15 02:47:07admin

在大模型当道的时代,代码的价值确实在不断降低。每天大数据都会推送大量由AI生成的网页内容,看久了难免会产生审美上的倦怠感。

这些网页总有一股浓浓的 AI 味,千篇一律的圆角卡片、卡片阴影、Tailwind 紫、 emoji 表情包…

昨天刚好被Kimi发布的K2.5模型刷屏了,这次他们主打的是视觉编程功能——无论是一张截图还是一段视频,都能复刻出几乎一模一样的网页。

今天,我们一起实测看看 Kimi K2.5 的“视力”和“品味”到底行不行?

01. 视觉编程测评

首先,我们直接把好看的模板截图发给 Kimi。

提示词很简单:复刻这个网站。

确实很惊艳,看得出来,K2.5 会识别和提取画面中的视觉素材,把图片转换成可交互的网页代码。

而且还自动做了响应式布局,可以直接切换手机/电脑网页端预览。

而且他们的Agent生成的网页还有个挺人性化的设计——只要点击右上角的编辑按钮,就能直接在预览界面里点选想要修改的地方,用大白话跟Kimi说清楚要改哪儿,就能精准调整好。

生成的网页,K2.5 会顺手帮我们部署上线。点击页面右上角的分享,就能直接复制访问链接。

复刻地址:https://rqgcia4tyj2lk.beta-ok.kimi.link

让我们再来考察一下视频复刻的能力。

提示词继续延伸简单的风格:帮我复刻一个一模一样的网页。

Kimi K2.5对视频画面特征的捕捉相当精准,布局、色彩搭配以及信息层级的还原都十分到位,看起来就如同参照原样制作而成,AI的痕迹确实淡了不少。

02. 视觉理解测评

Kimi K2.5 最关键的底层变化,就是原生的视觉能力,可以直接看懂图片和视频里的界面结构和细节。

所以接下来,我们来考察一下非编程领域的视觉能力。

这是一张北京鹞儿胡同的照片,图里除了胡同这个元素,没有任何醒目的地标或者文字提示,看看 Kimi 能看出什么。

提示词:判断一下这是在哪里。

Kimi 识别出了这是北京二环的老胡同,锁定了几个大致位置,不过让它直接说出鹞儿胡同看来还有点难。

再试试让 Kimi 判断一下画面中靠近车门的男生的身高。

Kimi 几乎是秒答,给我的回答是这位男生的身高大约在 183-188 厘米之间,最可能在 185 厘米左右。

龚俊的官方身高是 186 厘米,非常贴近!(我承认,这道题我多少是有点私心的)

我们继续上强度,我找了一道25年的行测真题发给 Kimi。

提示词:回答这道行测题。

在短暂的推理后,Kimi 很快抓住了这道题的关键点在于相同图案的相对位置,从而选出了正确答案 D。

到这里,K2.5 视觉能力已经很直观了,虽然猜地点可能没办法精准定位,但视觉推理是长板,能从画面中抽取有效信息,支撑推理。

03. 视觉 Agent 测评

这次除了模型本身,我留意到Kimi还悄然上线了一套办公助手Agent,主要针对日常工作中PPT、Word、Excel等各类文件的处理需求。

我们来看看能否终结 Office手搓时代?

文档 Agent

提示词:结合“双碳”目标背景,论述绿色低碳发展对中国经济高质量发展的现实意义。输出为 1500 字的 pdf 文件,杂志内页风格,双栏排版。

好像已经不用过多描述了,文风契合杂志的要求,杂志内页排版也好看,目前市面上这个文档助手好像没有竞争者。

04. Agent 集群

根据官方介绍,Agent集群是K2.5版本的全新尝试,它实现了从单个Agent到Agent团队的升级。在处理复杂任务时,K2.5可以主动生成自己的“分身”,并依据需求组建包含不同角色的团队,开展并行协作。

于是我测试了这个提示词:

请五个风格截然不同的中国知名艺术家或IP设计师,为我设计5个系列、每个系列10张的马年主题微信红包封面图片,我希望风格各异。

Kimi K2.5 创建了 5 位不同风格的设计师,并给他们分派图片生成任务。

我们一起看看生成的结果:

5 种风格里新水墨风和水墨风风格有点接近,整体质量都挺不错的,画面清晰,图案也好看,可以直接作为封面图用了。

平时自己找真题资料,很难一次性找全,好不容易有比较全面的合集,下载都需要付费。

Agent 集群也能帮我把10年真题和解析打包整理好,直接一键下载,这个属实厉害。

提示词:批量下载近10年国考行测真题与答案解析。

除此以外,还可以把收集数据和可视化的工作一起跑。

对近10年我国各省份的GDP数据及其涨跌变化情况开展详尽调研,并采用中国地图热力图的形式进行可视化呈现。系统默认显示2025年的GDP数据,同时支持不同年份间的切换查看。

比如,梁顾问负责收集数据,笛卡尔负责开发一个可交互的热力图网页,静秋负责将梁顾问收集的数据集成到网页中。

我们就得到了一份真实可用的热力图网页。

05. 一些分享

Kimi K2.5 以全能 Agent 模型为核心定位,新增了视觉功能,同时升级了 Office 处理、代码编写能力,并配备了支持无限分身的 Agent 集群系统。

这或许表明,大模型正逐步从“搜索引擎、问答助手”的角色,向“私人AI助手”乃至“商用数字员工”演进。未来的竞争核心将不再局限于参数规模与榜单排名,而是聚焦于谁能在实际工作场景中为用户承担更多流程环节。

很多重复性的脑力工作会被重新定价。内容生产、基础开发、设计初稿、资料整理,这些过去靠经验堆出来的时间成本,会被模型直接压平。

最后拼的是审美是否过关,策略是否有效。

在你的监督下,把事情做成,才是新的分水岭。

原文链接:Kimi 上新 K2.5 模型,国产 AI 开始卷审美了?