大语言模型
-
Meta AI基础设施十年演进:从GPU集群到自研芯片的下一代蓝图
关键词:基础设施演进、AI集群、大语言模型、GPU扩展、自研芯片 我们仍处于人工智能工作负载演进和应用的早期阶段。过去几年我们一直忙碌不停,而未来几年的发展速度将更快。人工智能对硬件提出的需求,丝毫没有放缓的迹象。 在过去的21年里,Meta实现了指数级增长,从一个连接美国几所大学数千人的小型社交网络,发展成为拥有多款应用程序和新型硬件产品、服务全球超过34…
-
LLM驱动的跨平台内核自动生成:融合监督微调与强化学习的智能优化新范式
关键词:LLM、内核生成、自动化优化、智能体、基准测试 现代人工智能系统的性能从根本上受制于底层内核的质量,这类内核可将高层算法语义转化为底层硬件操作。要实现接近最优性能的内核,需要研发人员具备专家级的硬件架构知识与编程模型认知,这使得内核工程成为一项至关重要但耗时冗长且不具备可扩展性的工作。 Towards Automated Kernel Generat…
-
AscendKernelGen:突破NPU算子生成瓶颈,大语言模型领域适配实现95.5%编译成功率
关键词:昇腾 Ascend、NPU 内核生成、大语言模型、领域适应、强化学习、评估基准 在人工智能飞速发展的今天,深度学习的计算需求呈指数级增长,传统的 CPU 和通用 GPU 已难以满足特定场景下的高效计算要求。为此,神经处理单元(Neural Processing Unit,NPU) 作为专为 AI 计算设计的领域专用加速器,逐渐成为现代 AI 基础设施…
-
具身智能新纪元:LLMs与世界模型融合如何重塑物理世界交互
本文全面探讨具身智能(Embodied AI) 的基础与前沿进展,核心聚焦大语言模型/ 多模态大模型 与世界模型(WMs ) 对具身智能的赋能作用 ——LLMs/MLLMs 通过语义推理和任务分解强化具身认知 ,WMs 通过构建外部世界的内部表征和未来预测 支撑物理合规交互,二者融合形成的MLLM-WM 联合架构 成为突破复杂物理世界任务的关键方向。 具身智…
-
突破RISC-V迁移瓶颈:首个RVV适配基准揭示LLM代码迁移潜力,20%通过率提升方案开源
关键词: RISC-V Vector Intrinsic、Code Migration、Benchmark、Large Language Model、Intrinsic Code VecIntrinBench: Benchmarking Cross-Architecture Intrinsic Code Migration for RISC-V Vector…
-
阿里千问突破大模型强化学习稳定性难题:从序列级奖励到token级优化的理论重构与实践验证
在人工智能领域,大语言模型(LLM)的强化学习(RL)训练已成为提升模型复杂推理与问题解决能力的关键技术路径。然而,当前主流RL方法普遍面临一个根本性矛盾:奖励信号通常基于完整生成序列(序列级)进行评估,而优化过程却在单个token级别进行。这种“奖励-优化”层级的不匹配不仅引发了理论上的健全性质疑,更在实际训练中导致稳定性问题,特别是在混合专家(MoE)等…
-
Yann LeCun离职Meta:世界模型与LLM的路线之争,AI未来何去何从?
近日,AI界传来重磅消息:图灵奖得主、Meta首席AI科学家Yann LeCun即将离职。这一事件不仅标志着Meta内部AI战略的重大调整,更折射出当前人工智能领域关于技术路线的深刻分歧。LeCun作为深度学习奠基人之一,其离职背后是LLM(大语言模型)与“世界模型”两种AI发展路径的激烈碰撞,值得我们深入分析。 LeCun离职的直接导火索,是Meta内部A…
-
AI安全攻防战:对抗提示突破T2I防线,幻觉机制精准拆解,通用模型竟优于专业模型
当AI模型从实验室走向实际应用,安全与可靠性的博弈日趋白热化。文本到图像模型的安全防线可能被“隐形”的对抗性提示轻易绕过;大语言模型即便掌握了正确答案,也可能“自信满满”地输出错误信息;而在科学应用场景中,通用模型的表现甚至可能超越为特定领域打造的专业模型。这些看似矛盾的现象,恰恰构成了当前AI安全领域最核心的挑战。本期《AI安全周刊》将深入探讨从利用LLM…
-
T2R-Bench发布:业内首个由表格生成报告工业基准
论文标题: T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial Tables 收录会议: EMNLP 2025 Main Conference 论文链接:https://www.arxiv.org/pdf/2508.19813 Huggi…
-
AI安全攻防进入精细化对抗时代:从表情符号到GUI代理的全场景威胁分析
随着大语言模型(LLM)在生产环境中的深度部署,AI安全领域正经历一场从粗放防御到精细化对抗的范式转变。传统基于规则和静态检测的安全机制已难以应对日益复杂的攻击向量,而攻击者正利用LLM系统的固有特性,从嵌入式固件到学术评审系统,从GUI交互界面到日常表情符号,构建起多维度的渗透路径。本周的多项研究揭示了这一趋势的严峻性,同时也展现了“以AI对抗AI”防御技…