Agent

  • 斯坦福伯克利英伟达联手:LLM-as-a-Verifier验证框架,扩展计算量显著提升Agent性能

    LLM-as-a-Verifier:斯坦福、伯克利与英伟达联合提出的验证框架,通过扩展计算量显著提升Agent性能 Transformer论文作者Lukasz Kaiser及GAN论文作者Bing Xu共同转发了一项备受关注的工作——LLM-as-a-Verifier验证框架。该框架作为一种通用验证机制,能够与任意Agent Harness及模型无缝结合。 …

    5天前
    12500
  • DeepSeek-V4预览版发布:百万上下文、Agent能力领先,同步开源

    刚刚,DeepSeek 在官方公众号发文宣布,全新系列模型 DeepSeek-V4 的预览版本正式上线,并同步开源! DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能三大维度上均实现了国内与开源领域的领先。 秉承 DeepSeek 一贯的开放精神,本次发布的模型按大小分为两个版本,欢迎开发者、研究者和企业用户前往体验和下…

    2026年4月24日
    61900
  • DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

    刚刚,DeepSeek-V4来了! 预览版正式上线并同步开源。 一共两个版本: DeepSeek-V4-Pro:对标顶级闭源模型,1.6T,49B激活,上下文长度1M; DeepSeek-V4-Flash:更小更快的经济版,284B,13B激活,上下文长度1M。 官方原话是:在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。 并且: 目前De…

    2026年4月24日
    29600
  • 入职腾讯后姚顺雨首秀:混元Hy3 preview开源,295B参数专攻Agent和Coding

    入职腾讯后,姚顺雨交出了首张答卷。 腾讯混元最新的基座模型——混元Hy3 preview,现已正式官宣并开源,并已上线元宝和WorkBuddy。 该模型总参数为295B,但激活参数仅为21B。其体量不大,定位明确:聚焦实用性,在真实业务场景中实现高效应用。 官方标注的核心能力是 Agent 和 Coding。这恰好是姚顺雨在OpenAI期间深耕多年的领域。他…

    2026年4月23日
    38700
  • 谷歌第8代TPU发布:训推分离芯片,性能飙升,Agent时代加速

    TPU 被低估了。 看完谷歌最新发布的第 8 代 TPU,我终于理解了马斯克这句话的含义。 谷歌专为 Agent 时代打造的第 8 代 TPU,其核心亮点在于: 一是,在「训推分离」的道路上,谷歌比英伟达走得更远——直接推出了两款物理上完全不同的芯片。 训练专用芯片 TPU 8t:整体计算性能是上一代产品的近三倍,能将模型训练周期从数月缩短至数周。 推理专用…

    2026年4月23日
    14200
  • Kimi 2.6震撼发布:最强开源Agentic Coding模型,Vibe Coding审美拉满,Agent集群可调度300子Agent

    Kimi 2.6 正式发布,带来了在代码生成、长程任务执行和原生视觉理解方面的显著增强。 在多项高难度基准测试中,例如考察综合软件工程能力的“人类最后的考试”,Kimi 2.6 均取得了领先的成绩,其表现与 GPT-4o、Claude 3.5 Sonnet 等顶尖闭源模型持平甚至更优。 本次更新并非简单的功能迭代,而是 Kimi 在 AI 智能体(Agent…

    2026年4月21日
    66900
  • Agent革命:从“养龙虾”到数字同事,实体企业如何安全递枪?

    在新茶饮行业,高峰期的订单峰值监控、多区域门店的运营数据汇总、跨系统的业务异常排查,一直是茶饮品牌技术团队的日常高频工作。 某茶饮品牌在测试使用智能体(Agent)的过程中发现,技术团队只需要向智能体提问“当前的QPS是多少”、“订单状态是多少”等问题,它就能串联整个流程并输出结果,员工不再需要登录多个平台查看,显著提升了效率。 不止是新茶饮赛道,这股Age…

    2026年4月19日
    19800
  • 小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

    上周,两个未署名的匿名模型悄然上架知名 API 聚合平台 OpenRouter,代号分别为“Hunter Alpha”和“Healer Alpha”。它们在没有任何官方宣传的情况下,调用量开始以异常的速度持续攀升。 其中,Hunter Alpha 更是多日登顶平台日榜,累计调用量突破 1T tokens,引发了社区的广泛猜测。最主流的观点认为其来自 Deep…

    2026年3月19日
    60900
  • AReaL v1.0发布:一键接入RL训练,OpenClaw等Agent框架迎来强化学习新纪元

    2026年开年,智能体(Agent)依然是全球AI领域最受关注的赛道之一。由OpenClaw(原Clawbot)掀起的Agent热潮持续发酵,其影响力甚至让“一人公司”的概念首次具备了现实落地的可能性。 近日,OpenClaw在GitHub上的Star数量已超越React和Linux,成为非资源/教程类开源软件项目中最为瞩目的存在。 从浏览器智能体到代码智能…

    2026年3月4日
    94600
  • MiniMax M2.5引爆AI需求:周调用量破3T,开源Agent生态全面接入

    这个春节,MiniMax 杀疯了。 2 月 20 日,港股马年首个交易日,MiniMax 收盘股价报涨 14.52%,市值一度冲破 3042 亿港元。 这轮上涨并非只是资本市场的情绪宣泄。 过去两年,AI 行业的叙事几乎集中在供给侧,比如更强的模型、更快的芯片、更大的数据中心。然而,制约 AI 产业规模化落地的,除了供给侧的能力上限外,还有大量长期憋着、始终…

    2026年2月25日
    42900