GPU效率
-
AI算力争夺战:腾讯600万算法大赛开启,探索推荐系统Scaling Law新纪元
黄仁勋在 GTC 大会上提出,Token 是 AI 时代的新货币,谁能用每瓦特电力产出更多高价值的 Token,谁就能占据优势。几乎与此同时,奖金池高达 600 万元的腾讯广告算法大赛开启报名,为全球算法人才提供了一个验证这一规则的实战平台。 “Token”、“推理成本”、“智能体”、“工作流程自动化”……这些原本主要在技术圈内流传的术语,近期因人工智能的热…
-
Agent Skill框架赋能小语言模型:12B模型技能选择准确率逼近90%,算力成本降低50%
关键词:Agent Skill 框架、小语言模型、上下文工程、工业应用、GPU 效率 近年来,以 GitHub Copilot、LangChain 等为代表的 Agent Skill 框架已成为大语言模型应用的重要范式。该框架通过精心设计的“静态技能库”,让模型在推理过程中渐进式地获取相关技能上下文,从而有效减少幻觉、提升工具使用的准确性。 然而,这一范式高…