编程模型 - 鲸林向海

DeepSeek V4正式发布：1.6T参数模型性能对标顶级闭源，Agent能力成最大亮点

星期五中午，本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。一上来就是王炸级别，而且双双标配百万 token 上下文：参数量达 1.6T 的 DeepSeek-V4-Pro（49B 激活参数）284B 参数的 DeepSeek-V4-Flash（13B 激活参数）即日起可在官网 chat.deepse…

2026年4月24日

1.2K000

大模型工程

阿里Qwen3.6-Plus突袭发布：编程能力捅破国产天花板，直逼Claude Opus

阿里Qwen3.6-Plus突袭发布：编程能力捅破国产天花板，直逼Claude Opus 阿里近日发布了新一代基座大模型Qwen3.6-Plus。该模型在编程和智能体能力上实现了显著突破，被视作国产大模型在该领域的新标杆。 Qwen3.6-Plus支持高达1M的上下文长度，能够独立拆解复杂任务、规划执行路径、进行自测迭代直至达成目标。其“Vibe Codin…

2026年4月3日

926000

AI产业动态

Cursor新模型Composer 2：性能超越Claude Opus 4.6，价格却“脚踝斩”，背后竟是“做笔记”强化学习黑科技

Cursor近日发布了其新一代编程模型Composer 2。该模型在多项基准测试中表现超越Claude Opus 4.6，同时定价显著降低。其背后核心是一种名为“自我总结”的新型强化学习训练方法。性能超越Claude，价格大幅降低 Composer 2是Cursor推出的最新编程模型。根据官方信息，该模型在包括Terminal-Bench 2.0和SWE-…

2026年3月20日

709000

AI产业动态

阿里开源Qwen3-Coder-Next：3B激活参数硬刚Sonnet4.5，智能体训练范式颠覆编程AI

今天凌晨，阿里开源了最新的编程模型 Qwen3-Coder-Next。其最引人注目的特点在于：一个仅激活 30亿参数的模型，在编程智能体任务上达到了与 Claude Sonnet 4.5 等顶级模型相当的水平。 Qwen团队在同步公开的技术报告中，提出了一个反行业直觉的核心结论： “扩展智能体训练规模，而非仅仅扩大模型规模，才是提升现实世界编码智能体能力的…

2026年2月4日

438000

AI产业动态

Dato：突破内存墙，数据流加速器编程新范式实现98%理论峰值利用率

关键词：Dato、数据流加速器、任务型编程模型、通信抽象、虚拟-物理映射随着人工智能计算的不断发展，数据流加速器将扮演越来越重要的角色。Dato为这些复杂硬件的编程提供了全新的思路，有望成为下一代人工智能计算基础设施的关键组成部分。 Dato的核心创新在于其类型系统的设计，将数据通信和数据分片都提升为一等类型，这使得编译器能够在早期阶段进行深入的分析和优化…

2026年1月17日

420000

大模型评测

智谱GLM-4.7全面评测：编程专用模型性能跃升，开源优势凸显

智谱AI昨日开源了其编程专用模型GLM-4.7。相较于前代GLM-4.6版本，新模型在多项关键指标上实现了显著提升。我们对两个版本进行了全面评测，对比了准确率、响应时间、Token消耗及成本等维度。 GLM-4.7版本核心测试数据如下：* 测试题数：约1.5万* 总分（准确率）：71.5%* 平均耗时（每次调用）：96秒* 平均Token（每次调用）：392…

2025年12月23日

1.8K000