一个人就是一个团队的时代,来了吗?
“群体智能”这个词,我见过太多产品拿来当营销词用。打开一看,就是一个模型套了个壳,换个 UI,然后告诉你这是“多智能体协作”。
既然是 Kimi 声称“Agent集群”可以调度那么多 Agent 并行完成任务,那咱们就给“AI团队”上点压力:
测试一:模拟券商公司产出全球AI算力产业研究报告(用时~1.25小时)
模拟券商研究所,产出全球AI算力产业链深度研究。
要求一次性交付五样东西——80-100页PDF报告、30家公司DCF/PE/PEG三套估值的Excel、25-30页高管PPT、一页纸股票池跟踪看板、一个独立的HTML视觉看板(含产业链全景图、估值热力图、龙头雷达图)。
组织协作这件事,它好像真的会。
收到任务后,K2.6 自动拆解任务为 8 个 Stage:
12 个专业研究团队“保驾护航”:
过程中,它主动调用了多个Skill(screensheet处理Excel、doc处理Word/PDF/PPT、frontend-skill处理HTML),并创建了专门的智能体负责报告/PPT的结构设计与文案骨架。
这里要插一句:你是不是也在网上天天找“把PDF转成网页”的skill?
结果从0开始部署、买API、忙活半天最后等到一个什么也不能用的东西?
K2.6直接把整个流程封装好了。你想要什么skill,告诉它,它来帮你解决。
相比较 codex 这么密密麻麻的字,不得不说 kimi 用户体验是真的好。
1个多小时后,去吃顿晚饭的功夫,回来彻底傻眼了。
界面上是它交付的:
- 97页PDF
- 11个Sheet的Excel
- 26页PPT
- 1页Word看板
- 一个完整的ECharts可视化HTML页面
- 外加6张经济学人风格的科研图表
一次性,一条龙,全做出来了。
还给了6张附加产出,再一次秀了K2.6的制图能力(且可编辑)。
据以前在投行待过的朋友说,过往金融分析师写一份完整研报,平均耗时80小时以上。
不是他们不努力,是这件事本身就是体力活。
数据拉取、财务建模、行业分析、排版设计,每一环都是独立的专业技能,而且是串行的——数据组做完,建模组才能开始;建模组做完,撰写组才能动笔。
券商研究员人均年产研报约20-30篇,按每篇80小时算,一年有效工作时间几乎全耗在这上面了。
下面我们就一口气看看AI到底产出了什么东西:
1、全球AI算力产业链视觉看板(HTML)
2、深度产业研究报告(PDF)绝杀!
97页,11.39MB,含6张嵌入的科研图表。
目录结构完整,从行业概览到五大环节拆解,再到30家公司的逐一分析,附录还有数据来源说明。
排版用的是“经济学人”式的高清矢量图风格。
不得不说,干净、专业!
3、全球AI算力产业链深度研究(PPT)
26页,彭博终端深色风格。每页都有数据支撑,图表与Excel模型同步。
可以直接拿去给老板汇报,不用再自己调格式。
4、AI算力产业链综合财务估值模型(Excel)
11个Sheet,覆盖30家公司的DCF+PE+PEG三套估值:
5、AI算力股票池跟踪看板(Word)
AI测评内容仅供交流学习,不可作为投资建议
可以说,这样一个企业级的任务,K2.6完成的真的还不错。
以及大家最担心的“数字幻觉”问题,据官方说,目前K2.6支持调用专业数据库 :天眼查、同花顺等,无需再额外购买这些数据的会员。
对于经常要花钱买数据的同学,这么一个自带数据库的自动化数据可视化工具真的很香了。
搞完金融了,咱们再试试他的Coding能力如何。作为官方强调的“设计师级别的前端”,效果如何。
测试二:一键生成论文草稿的智能工作台(用时~45min)
K2.6自动拆解任务,创建了项目结构,阅读了相关设计文档(react-dev.md、design.md、visualization.md),然后开始实现:
- 开屏动画自动生成(淡入淡出+呼吸感)
- 左右分栏布局:左侧半透明笔记栏,右侧主编辖区
- 笔记输入后实时生成论文结构
- 参考文献悬停卡片效果
- Three.js实现的3D分子/数据可视化占位
- 一键导出PDF功能(套用LaTeX模板样式)
这次只用了两个角色,但是效果依然很惊艳。
下面是自动生成的开屏页动画:
这是他嵌入前端设计后的效果:
怎么说呢,总感觉有点“那味儿了”。
反正比我自己设计的好看哈哈。
交互也很丝滑,悬停在左侧的文献会显示论文摘要:
不得不说,这审美确实在线,开屏动画、字体搭配、留白、交互反馈都远超一般AI生成的前端。交互逻辑清晰,体验感也很流畅。
美中不足的是,我并没有要求这个网页配备后端和数据库,似乎需要主动提示还能唤起。
功能上还“不太能用”——数据持久化、多轮编辑、导出PDF的格式完善度、参考文献的自动抓取等生产级能力还有欠缺,离真正可用的科研工具还有距离。
据官方说的是,目前已经可以在添加预约系统、表单功能,来收集访客信息并支持账号登录了。
这对于普通用户而言,已经足够用了,把从0到1的门槛砍掉90%。
絮叨
跑完这两个案例,我有两个强烈的感受。
第一,K2.6 真的在探索 AGI 的可能性。
你见过哪个模型能同时调度 300 个 Agent,并行跑 4000 多个步骤,替你写完一份 97 页的券商报告,再做出一张设计师级别的论文工作台?
K2.6 不只会“听话干事”。
它会自己试错、自己迭代、自己拆解任务、自己调用工具(而且不用本地部署和科学上网),这已经不单单是简单的代码生成和工程实现,而是有逻辑的“工程自主性”。
第二,它知道自己的边界。
K2.6 不是完美的,它的功能还有提升空间,它的推理能力还不是最强。
但它是目前开源模型里,最接近“真能帮你干活”的那个,因为它是开源模型里目前的最强者。
如果你还没试过,建议你去试试。不用懂代码,只管打开 Kimi,说人话,看它干活。
然后告诉我,你用它做了什么。
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/32007

