大语言模型
-
AI工具使用能力评测新突破:WildToolBench揭示大语言模型在真实场景中的巨大差距
关键词:大语言模型、工具使用、基准评测、真实场景、智能体 当 AI 从实验室走向真实世界,简单的任务竟可能成为难以逾越的鸿沟。 假设你正在准备一场关于“2024年热门电影推荐”的演示,于是向 AI 助手发出指令:“帮我查查今年最火的几部电影,然后做个简单的调查问卷 PPT。” 在实验室的理想环境中,AI 或许能完美地执行这一任务:调用电影搜索 API 获取列…
-
从科幻到现实:Karpathy的autoresearch项目如何让AI自主研究成为可能
关键词:自主 AI 研究、大语言模型、自我进化、自动化机器学习、程序优化 想象这样一个场景:曾经,前沿的 AI 研究是由那些被称为“肉计算机”的人类完成的——他们需要吃饭、睡觉、享受生活,偶尔通过一种叫做“组会”的声音波互联方式进行同步。那个时代早已远去。 如今,研究完全由在天空中计算集群巨型结构上运行的自主 AI 智能体群完成。这些智能体声称我们正处于代码…
-
ArchAgent:AI仅用两天设计出性能提升5.3%的缓存策略,颠覆传统硬件设计
关键词:AI 驱动硬件设计、缓存替换策略、大语言模型、进化算法、计算机架构 一个完全由 AI 驱动的系统,在没有任何人类干预的情况下,仅用两天时间就设计出了一款比现有最优方案性能提升 5.3% 的缓存替换策略——而人类专家团队完成同样的工作通常需要数月之久。 ArchAgent: Agentic AI-driven Computer Architecture…
-
LLM与强化学习融合:开启智能推荐新纪元,首篇系统性综述发布
强化学习(RL)将推荐系统建模为序列决策过程,支持长期效益和非连续指标的优化,是推荐系统领域的主流建模范式之一。然而,传统 RL 推荐系统受困于状态建模难、动作空间大、奖励设计复杂、反馈稀疏延迟及模拟环境失真等瓶颈。近期,大语言模型(LLM)的崛起带来了新机遇。LLM 凭借常识储备、推理能力和语义天赋,不仅能让智能体更懂用户,还能充当高保真的环境模拟器。LL…
-
RL驱动的KV缓存压缩框架KV Policy:超越启发式策略SOTA性能,仅增1%预填充计算开销
关键词:大语言模型、KV 缓存、强化学习、缓存驱逐、长上下文推理 自 Transformer 架构诞生以来,大型语言模型(LLMs)在自然语言处理领域取得了革命性进展。从文本生成到逻辑推理,从多轮对话到长文档理解,LLMs 的能力边界不断拓展。然而,模型性能的飞跃背后,是日益严峻的推理效率挑战——当处理长序列或交互式会话时,KV(Key-Value)缓存成为…
-
SynPerf:混合分析与机器学习融合,GPU性能预测实现6.1%内核误差与1.7倍加速
关键词:GPU 性能建模、混合建模、大语言模型、硬件泛化性、性能优化 让 AI 学会“自我审视”:在真实硬件运行前,精准预测每一行代码的执行时间。 2025 年的今天,从 Gemini 到 Llama-3,从 Qwen 到 DeepSeek,大型语言模型(LLMs)正在以前所未有的速度重塑我们的生活。这些动辄百亿、千亿参数的“数字大脑”,背后依赖的是成千上万…
-
从AlphaGo到DeepSeek R1:推理模型如何重塑AI生产力与人类未来
如果把人生看作一个开放式的大型多人在线游戏(MMO),那么游戏服务器在刚刚完成一次重大更新的时刻,规则改变了。 自 2022 年 ChatGPT 惊艳亮相以来,世界已经发生了深刻变化。在短短几年内,人工智能正从模仿语言的统计机器,迈向理解与操纵逻辑的思考系统。如果说早期的大语言模型更像是在进行高维概率空间中的词汇拼贴,那么新一代推理模型,则开始学会在生成之前…
-
高通QuoKA:无需训练、硬件无关,88% KV缩减实现5倍推理加速,革新LLM预填充效率
关键词:大语言模型、稀疏注意力、分块预填充、KV 选择、推理加速 无需训练、不依赖特定硬件,仅用 12% 的 KV 对就能实现接近全注意力的效果——这就是 Qualcomm AI Research 带来的全新稀疏注意力算法。 近年来,随着大型语言模型(LLM)的广泛应用,其推理效率逐渐成为制约落地的重要因素。尤其是在预填充阶段——即模型需要一次性处理整个输入…
-
自进化Agent突破量化因子挖掘瓶颈:QuantaAlpha框架实现27.75%年化收益
上财团队 投稿 量子位 | 公众号 QbitAI 在量化金融的底层,Alpha因子本质上是一段可执行的代码逻辑,它们试图将嘈杂的市场数据映射为精准的交易信号。然而,长期以来,自动化因子挖掘始终被困在“两难”的夹缝中:传统的遗传规划 (Genetic Programming,GP) 虽然擅长在海量空间中进行进化搜索,但其本质是“盲目的随机变异”。 它们在回测中…
-
LLM重构数据准备:从规则驱动到语义驱动的范式革命
在企业级系统中,数据团队普遍面临一个困境:模型迭代飞速,但数据准备的「老旧管道」却愈发沉重。清洗、对齐、标注……这些工作依然深陷于人工规则与专家经验的泥潭。 数据格式五花八门:正则表达式越写越多,却总有意想不到的「脏数据」出现。 跨系统表结构不一致:对齐逻辑复杂,人工映射耗时耗力。 海量数据缺少标签和语义描述:分析师「看不懂、用不好」。 这背后是数据准备这一…
