实测下来，KimiK2.5是目前最贴近Gemini3Pro的国产开源模型

发布时间：2026-02-15 02:47:07admin

在大模型当道的时代，代码的价值确实在不断降低。每天大数据都会推送大量由AI生成的网页内容，看久了难免会产生审美上的倦怠感。

这些网页总有一股浓浓的 AI 味，千篇一律的圆角卡片、卡片阴影、Tailwind 紫、 emoji 表情包…

昨天刚好被Kimi发布的K2.5模型刷屏了，这次他们主打的是视觉编程功能——无论是一张截图还是一段视频，都能复刻出几乎一模一样的网页。

今天，我们一起实测看看 Kimi K2.5 的“视力”和“品味”到底行不行？

01. 视觉编程测评

首先，我们直接把好看的模板截图发给 Kimi。

提示词很简单：复刻这个网站。

确实很惊艳，看得出来，K2.5 会识别和提取画面中的视觉素材，把图片转换成可交互的网页代码。

而且还自动做了响应式布局，可以直接切换手机/电脑网页端预览。

而且他们的Agent生成的网页还有个挺人性化的设计——只要点击右上角的编辑按钮，就能直接在预览界面里点选想要修改的地方，用大白话跟Kimi说清楚要改哪儿，就能精准调整好。

生成的网页，K2.5 会顺手帮我们部署上线。点击页面右上角的分享，就能直接复制访问链接。

复刻地址：https://rqgcia4tyj2lk.beta-ok.kimi.link

让我们再来考察一下视频复刻的能力。

提示词继续延伸简单的风格：帮我复刻一个一模一样的网页。

Kimi K2.5对视频画面特征的捕捉相当精准，布局、色彩搭配以及信息层级的还原都十分到位，看起来就如同参照原样制作而成，AI的痕迹确实淡了不少。

02. 视觉理解测评

Kimi K2.5 最关键的底层变化，就是原生的视觉能力，可以直接看懂图片和视频里的界面结构和细节。

所以接下来，我们来考察一下非编程领域的视觉能力。

这是一张北京鹞儿胡同的照片，图里除了胡同这个元素，没有任何醒目的地标或者文字提示，看看 Kimi 能看出什么。

提示词：判断一下这是在哪里。

Kimi 识别出了这是北京二环的老胡同，锁定了几个大致位置，不过让它直接说出鹞儿胡同看来还有点难。

再试试让 Kimi 判断一下画面中靠近车门的男生的身高。

Kimi 几乎是秒答，给我的回答是这位男生的身高大约在 183-188 厘米之间，最可能在 185 厘米左右。

龚俊的官方身高是 186 厘米，非常贴近！（我承认，这道题我多少是有点私心的）

我们继续上强度，我找了一道25年的行测真题发给 Kimi。

提示词：回答这道行测题。

在短暂的推理后，Kimi 很快抓住了这道题的关键点在于相同图案的相对位置，从而选出了正确答案 D。

到这里，K2.5 视觉能力已经很直观了，虽然猜地点可能没办法精准定位，但视觉推理是长板，能从画面中抽取有效信息，支撑推理。

03. 视觉 Agent 测评

这次除了模型本身，我留意到Kimi还悄然上线了一套办公助手Agent，主要针对日常工作中PPT、Word、Excel等各类文件的处理需求。

我们来看看能否终结 Office手搓时代？

文档 Agent

提示词：结合“双碳”目标背景，论述绿色低碳发展对中国经济高质量发展的现实意义。输出为 1500 字的 pdf 文件，杂志内页风格，双栏排版。

好像已经不用过多描述了，文风契合杂志的要求，杂志内页排版也好看，目前市面上这个文档助手好像没有竞争者。

04. Agent 集群

根据官方介绍，Agent集群是K2.5版本的全新尝试，它实现了从单个Agent到Agent团队的升级。在处理复杂任务时，K2.5可以主动生成自己的“分身”，并依据需求组建包含不同角色的团队，开展并行协作。

于是我测试了这个提示词：

请五个风格截然不同的中国知名艺术家或IP设计师，为我设计5个系列、每个系列10张的马年主题微信红包封面图片，我希望风格各异。

Kimi K2.5 创建了 5 位不同风格的设计师，并给他们分派图片生成任务。

我们一起看看生成的结果：

5 种风格里新水墨风和水墨风风格有点接近，整体质量都挺不错的，画面清晰，图案也好看，可以直接作为封面图用了。

平时自己找真题资料，很难一次性找全，好不容易有比较全面的合集，下载都需要付费。

Agent 集群也能帮我把10年真题和解析打包整理好，直接一键下载，这个属实厉害。

提示词：批量下载近10年国考行测真题与答案解析。

除此以外，还可以把收集数据和可视化的工作一起跑。

对近10年我国各省份的GDP数据及其涨跌变化情况开展详尽调研，并采用中国地图热力图的形式进行可视化呈现。系统默认显示2025年的GDP数据，同时支持不同年份间的切换查看。

比如，梁顾问负责收集数据，笛卡尔负责开发一个可交互的热力图网页，静秋负责将梁顾问收集的数据集成到网页中。

我们就得到了一份真实可用的热力图网页。

05. 一些分享

Kimi K2.5 以全能 Agent 模型为核心定位，新增了视觉功能，同时升级了 Office 处理、代码编写能力，并配备了支持无限分身的 Agent 集群系统。

这或许表明，大模型正逐步从“搜索引擎、问答助手”的角色，向“私人AI助手”乃至“商用数字员工”演进。未来的竞争核心将不再局限于参数规模与榜单排名，而是聚焦于谁能在实际工作场景中为用户承担更多流程环节。

很多重复性的脑力工作会被重新定价。内容生产、基础开发、设计初稿、资料整理，这些过去靠经验堆出来的时间成本，会被模型直接压平。

最后拼的是审美是否过关，策略是否有效。

在你的监督下，把事情做成，才是新的分水岭。

原文链接：Kimi 上新 K2.5 模型，国产 AI 开始卷审美了？

攻略资讯

查看更多 →