AI产业动态

  • 性能飙升8倍!Vortex RISC-V GPGPU通过解耦控制流与内存访问实现革命性突破

    关键词: RISC-V GPGPU 、Vortex、控制流管理、 解耦内存访问 、硬件优化 、性能加速 从开源 GPU 的机遇与挑战说起。在当今计算领域,图形处理器(GPU)已从专为图形渲染设计的硬件,演变为支撑人工智能、科学计算和高性能计算的关键通用计算平台。 然而,绝大多数 GPU 研究依赖于 NVIDIA 等商业 GPU 的模拟框架,这些框架虽然功能强…

    2026年1月19日
    32000
  • AdaptCLIP:西门子与腾讯优图联合打造零样本工业异常检测新框架,无需微调实现精准定位

    AdaptCLIP:无需微调的零样本工业异常检测新框架 当前,视觉模型在工业“缺陷检测”等领域的应用已相对成熟。然而,广泛使用的传统模型在训练时对数据要求极高,需要大量精细标注的数据才能达到理想效果。 大模型则有望在“零样本/少样本识别” 条件下,达到与传统模型相当的性能。CLIP 是 OpenAI 于 2021 年发布的开源视觉-语言基础模型。本研究在其基…

    2026年1月19日
    20400
  • 评测驱动时代开启:李飞飞World Labs联手光轮智能,破解具身智能规模化评测难题

    最火世界模型,最火具身智能基建,联手了! 前者,是李飞飞旗下的World Labs;后者,是一家炙手可热的仿真合成数据公司——光轮智能。 具身智能生态中最受关注的两家公司双刃合璧,原因无他,正是瞄准困扰行业已久的「规模化评测」问题,发起一波攻势。 而随着这波号角的吹响,也标志着具身智能正式迈入评测驱动时代。 在这个赛道上,光轮智能基于全栈自研仿真技术体系所构…

    2026年1月19日
    21300
  • MIT革命性突破:RLM技术让大模型零改动解锁千万级上下文,推理性能飙升580倍

    MIT革命性突破:RLM技术让大模型零改动解锁千万级上下文,推理性能飙升580倍 让大模型轻松处理比自身上下文窗口长两个数量级的超长文本! MIT CSAIL研究团队提出了一种名为递归语言模型(RLM) 的长文本处理新方法,旨在解决“上下文腐烂”问题。该方法无需修改模型架构或升级模块设计,即可让GPT-5、Qwen-3等顶尖模型具备处理千万级Token超长文…

    2026年1月19日
    24000
  • 超越基础RAG:构建面向学术论文的智能检索系统实战

    在AI工程实践中,你很快会意识到:并不存在一张可以完全照搬的“通用蓝图”。 对于检索增强生成(RAG)中的基础检索(“R”),标准流程包括文档分块、查询语义搜索、结果重排等。这套流程已广为人知。 但随着系统深入应用,一个问题会浮现:如果一个系统对一篇文档的理解仅限于几个零散的文本块,我们如何能称其为“智能”? 那么,如何确保系统获得足够的信息,从而做出“聪明…

    2026年1月19日
    18100
  • AI安全新突破:揭秘LLMs新型攻击链与高效防御策略

    AI安全新突破:揭秘LLMs新型攻击链与高效防御策略(一) 本周的研究聚焦于大型语言模型面临的新型攻击方式与创新防御策略。这些成果揭示了模型在文本布局、推理和生成过程中的固有弱点,展现了AI安全领域的最新进展。分析表明,当前攻击方法的成功率显著提升,而相应的防御技术也正朝着高效、实用和精细化的方向发展,这对构建更可靠、更安全的AI系统至关重要。 一、关键发现…

    2026年1月19日
    99400
  • 液冷服务器:AI算力时代的散热革命与万亿市场机遇

    第一章 行业绪论:液冷服务器的崛起逻辑与时代价值 01 概念界定与技术本质 液冷服务器是通过液体介质(氟化液、水基液、矿物油等)替代传统空气介质,实现服务器核心部件(CPU、GPU、ASIC芯片等)热量高效转移的先进计算硬件设备。 其核心原理基于液体远优于空气的热传导特性——液体的热传导效率是空气的1000倍以上,比热容更是空气的数千倍,能够在极小的体积内快…

    2026年1月19日
    30700
  • 上交、清华提出面向 LLM 推理的多核 NPU 创新策略:全栈多维度优化实现1.32x-6.03x超 SOTA 加速

    关键词:多核NPU、LLM推理、NpuSim模拟器、张量并行、内存管理、PD分拆与融合 随着 ChatGPT、Qwen、DeepSeek 等大型语言模型(LLM)的广泛应用,AI 应用正在经历一场前所未有的变革。从智能助手、代码生成到自动驾驶,LLM 正在成为数字时代的“新电力”。然而,这场变革的背后隐藏着一个严峻的挑战:如何高效地运行这些庞然大物? 传统的…

    2026年1月18日
    22500
  • 美团LongCat-Flash-Thinking-2601评测:工具调用亮眼,但基础推理与视觉理解存短板

    美团近期发布了LongCat-Flash-Thinking-2601模型,作为首个支持在线免费体验「重思考模式」的开源模型,其核心宣传点在于强大的工具调用能力。官方称其在智能体搜索、智能体工具调用、工具交互推理等关键评测中均达到了开源模型的SOTA水平。 核心评测结论: 三大亮点: 工具类网页完成度高:水印处理工具功能完整、交互流畅;复利计算器UI专业、图表…

    2026年1月18日
    18600
  • 马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

    全球首个GW级超算集群Colossus 2震撼上线 刚刚,全球首个GW级超算集群Colossus 2,正式投入运行。 马斯克兴奋地宣布: 这是全球首个达到1GW的超算集群,4月还将进一步升级至1.5GW。 网友直呼疯狂:「1.5GW,光是插座估计都得给墙壁装满了。」 有了这剂算力强心针,Grok的忠实拥趸已经开始畅想Grok 5的统治时代。 但在全网狂欢的背…

    2026年1月18日
    18600