长程任务
-
小米AI 4小时手搓macOS!国产Agent MiMo-V2.5 Pro开源,长程任务吊打GPT-5.4
先别讨论什么参数和基准测试了,来看个硬核操作—— 小米版“macOS Sequoia”桌面系统(狗头)。 开机动画、用户登录、窗口管理、Dock栏缩放、Spotlight搜索、明暗显示风格、Launchpad启动台,一应俱全。 还内置了54个原生应用,打开计算器能算账,打开日历能看日期,打开地图能查地址,打开备忘录能记录,Grapher还能绘制3D函数图………
-
GLM-5.1颠覆CUDA优化:AI 14小时完成人类数月工作,开源模型首次全面对齐Claude Opus 4.6
GLM-5.1 在 CUDA 优化领域实现突破:AI 以小时级效率完成传统需数月的工作 在 GPU 计算优化领域,一项新的进展正在改变工作范式。传统上,优化 CUDA Kernel 需要资深工程师投入数月时间进行反复测试与调优。如今,人工智能模型能在约 14 小时内自主完成同类复杂优化任务,并将性能加速比从初始的 2.6 倍显著提升至 35.7 倍。 这一过…
-
GLM-5.1-Turbo实测:开源第一模型如何用1小时开发完整应用并处理10万条数据
GLM-5.1-Turbo 发布后不久,智谱的 Coding Plan 服务便宣布了对该模型的支持。 我随即在 Claude Code 中切换至 GLM-5.1 模型进行了深度体验。经过数日的密集测试,我发现 GLM-5.1 并非一次简单的迭代升级,其能力,尤其是在处理长程任务方面,表现出了显著的代际跨越。 根据 Artificial Analysis、SW…
