长程任务 - 鲸林向海

小米AI 4小时手搓macOS！国产Agent MiMo-V2.5 Pro开源，长程任务吊打GPT-5.4

先别讨论什么参数和基准测试了，来看个硬核操作—— 小米版“macOS Sequoia”桌面系统（狗头）。开机动画、用户登录、窗口管理、Dock栏缩放、Spotlight搜索、明暗显示风格、Launchpad启动台，一应俱全。还内置了54个原生应用，打开计算器能算账，打开日历能看日期，打开地图能查地址，打开备忘录能记录，Grapher还能绘制3D函数图………

2026年4月28日

467000

大模型工程

GLM-5.1颠覆CUDA优化：AI 14小时完成人类数月工作，开源模型首次全面对齐Claude Opus 4.6

GLM-5.1 在 CUDA 优化领域实现突破：AI 以小时级效率完成传统需数月的工作在 GPU 计算优化领域，一项新的进展正在改变工作范式。传统上，优化 CUDA Kernel 需要资深工程师投入数月时间进行反复测试与调优。如今，人工智能模型能在约 14 小时内自主完成同类复杂优化任务，并将性能加速比从初始的 2.6 倍显著提升至 35.7 倍。这一过…

2026年4月8日

659000

大模型工程

GLM-5.1-Turbo实测：开源第一模型如何用1小时开发完整应用并处理10万条数据

GLM-5.1-Turbo 发布后不久，智谱的 Coding Plan 服务便宣布了对该模型的支持。我随即在 Claude Code 中切换至 GLM-5.1 模型进行了深度体验。经过数日的密集测试，我发现 GLM-5.1 并非一次简单的迭代升级，其能力，尤其是在处理长程任务方面，表现出了显著的代际跨越。根据 Artificial Analysis、SW…

2026年4月2日

1.3K000