• Meta裁员风暴背后:AI降本增效的双刃剑与CEO智能体的崛起

    如果说 Meta 去年的关键词是「砸钱抢人」,今年则转向了「为 AI 降本增效」。 前两周,路透社援引知情人士消息称,Meta 正在酝酿大规模裁员,可能影响公司 20% 甚至更多员工。按照 Meta 截至 2025 年底接近 7.9 万人的规模计算,潜在受影响人数可能超过 1.6 万。 近日,《华尔街日报》的一则报道揭示了另一层变化:据知情人士透露,扎克伯格…

    2小时前
    1700
  • IMMACULATE:揭秘黑盒LLM服务审计新框架,1%开销即可检测模型替换与Token虚报

    作者简介 本文作者分别来自新加坡国立大学和加州大学伯克利分校。第一作者郭衍培来自新加坡国立大学,长期关注大语言模型基础设施中的可信性与安全性问题,特别是云端LLM服务的可验证性与经济激励风险。指导教师为新加坡国立大学校长青年教授张嘉恒和加州大学伯克利分校Dawn Song教授。 引言:黑盒LLM服务的信任危机 大语言模型(LLM)已成为各类AI应用的基础设施…

    3小时前
    1600
  • 字节开源Deer-Flow2登顶GitHub Trending:35.3k星超级智能体框架,开箱即用多智能体协同

    字节开源Deer-Flow 2登顶GitHub Trending:35.3k星超级智能体框架,开箱即用多智能体协同 字节跳动开源的 Deer-Flow 2 超级智能体管理框架,在发布后迅速登上GitHub Trending榜首,目前已收获35.3k Star。 Deer-Flow 2采用模块化多智能体架构,智能体之间通过LangGraph实现协同合作。框架主…

    3小时前
    1200
  • 彼得·蒂尔20亿美元押注AI牛项圈:虚拟围栏颠覆传统养殖,60万头牛已戴上智能项圈

    最近,硅谷著名投资人彼得·蒂尔计划领投一轮高达20亿美元的融资,其投资对象竟是一款为奶牛设计的智能项圈。 彼得·蒂尔:为何是他? 彼得·蒂尔是硅谷风险投资界的标志性人物,PayPal的联合创始人,也是最早发现并投资Facebook的远见者之一。他参与创立了大数据公司Palantir,并早期押注了SpaceX。其“竞争是失败者的游戏”等投资理念在创投领域影响深…

    3小时前
    1500
  • AI技术作家Sebastian Raschka发布LLM架构画廊与注意力变体可视化指南,AI社区高度关注

    著名 AI 技术作家 Sebastian Raschka 近期发布了一份「LLM 架构画廊」,在 AI 社区内获得了高度关注和广泛赞誉。 图 1:LLM 架构图库及其视觉模型卡片概览。 该图库广受欢迎,Raschka 也已开始与合作伙伴生产实体海报,目前销量可观。 图 2:带有用于对比大小的随机物体的架构图库海报版本。 时隔仅一周多,Raschka 又发布了…

    3小时前
    1400
  • HiDrop:突破MLLM视觉Token压缩瓶颈,实现90%压缩率下98.3%性能保持

    随着多模态大语言模型(MLLM)支持的上下文长度不断增长,高分辨率图像和长视频输入会产生远多于文本的视觉标记(Token)。在自注意力机制二次计算复杂度的制约下,这些海量视觉Token迅速成为模型推理效率的瓶颈。 现有研究通常采用渐进式剪枝来减少视觉Token,但大多采用固定的剪枝策略,未能充分考虑MLLM不同层级在多模态信息处理中的功能差异。 通过对MLL…

    3小时前
    1400
  • Meta MobileLLM-Flash:以真实延迟为第一性原理,重塑端侧大模型设计范式

    关键词:端侧大模型、延迟感知、硬件在环、架构搜索、混合注意力 当你对着手机上的 AI 助手提问,然后等待……1 秒、2 秒、3 秒……直到第 10 秒,才看到第一个字出现。根据尼尔森定律,这种超过 4 秒的延迟,已足以让用户感到焦躁甚至放弃使用。这正是当前端侧大模型在追求“智能”时,常常忽略的“人性化”痛点。 业界普遍认为,模型的“快”等同于参数少、计算量低…

    17小时前
    2800
  • DeepSeek核心工程师郭达雅离职:V2、V3、R1模型核心作者,从“中山大学雷军”到百万奖金天才

    DeepSeek核心工程师郭达雅离职:V2、V3、R1模型核心作者 DeepSeek核心工程师郭达雅被曝离职。作为公司V2、V3、R1等一系列模型的核心作者,他的动向备受关注。 这位曾被导师寄予厚望成为“中山大学雷军”的技术天才,在学术与竞赛领域有着近乎传奇的履历:自述在博士入学第三天便完成了毕业所需的论文发表要求;多次在腾讯广告算法大赛中蝉联冠军,并在AT…

    17小时前
    6400
  • 马斯克发布Terafab项目:年产1太瓦算力,SpaceX与Tesla联手迈向星际文明

    北京时间上午8点,埃隆·马斯克在社交平台X上预告,将直播正式发布由其旗下SpaceX和特斯拉共同推进的“Terafab”项目。 该项目的核心目标是实现每年生产超过1太瓦(Terawatt,即10¹²瓦,一万亿瓦)的计算能力,涵盖逻辑芯片、内存芯片及先进封装。根据规划,其中约80%的算力将部署于太空,剩余约20%用于地面。 1太瓦的规模意味着什么?作为对比,2…

    17小时前
    4000
  • SWE-MiniSandbox:无需容器,低成本训练你的AI编程助手!北大团队开源轻量级SWE Agent训练框架

    本工作由北京大学王选计算机研究所赵东岩、张辉帅老师团队完成,第一作者为北京大学前沿交叉学科研究院硕士生袁旦龙。 随着软件工程智能体(SWE Agent)因其明确的应用前景与价值而备受关注,从业者尝试训练自己的智能体时却面临挑战。当前主流训练方法依赖容器技术(如 Docker)实现环境隔离与复现,但其高昂的基础设施与运维成本,尤其在扩展训练规模时,构成了显著的…

    1天前
    12700
点击查看更多