LightSearcher:基于经验记忆的深度思考大模型高效搜索框架 2天前 • 大模型工程 • 阅读 6 — 图片补充 — 关注“鲸栖”小程序,掌握最新AI资讯 本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/4591 强化学习优化深度思考大模型经验记忆 赞 (0) 0 0 生成海报 阿里万相2.6发布:国内首个声画一致角色定制模型,将专业影棚搬入手机 上一篇 2天前 ViLoMem:双流语义记忆破解大模型“金鱼记忆”难题,多模态推理性能显著提升 下一篇 2天前 相关推荐 大模型工程 DeepSeek 本地化部署:打造专属智能助手 本文详细介绍了如何在本地使用Ollama框架部署DeepSeek模型,涵盖硬件要求、安装步骤、界面搭建及注意事项,帮助用户打造安全私密的个人智能助手。 2025年10月15日 95000 大模型工程 大模型流式输出打字机效果的前后端实现 1. 背景 在使用ChatGPT时,发现输入 prompt 后,页面是逐步给出回复的,起初以为使用了 WebSckets 持久化连接协议,查看其网络请求,发现这个接口的通信方式并非传统的 http 接口或者 WebSockets,而是基于 EventStream 的事件流,像打字机一样,一段一段的返回答案。 ChatGPT 是一个基于深度学习的大型语言模型,… 2025年10月1日 299010 大模型工程 LLM 大模型工程师:AI 时代的弄潮儿 随着 LLM 技术的不断发展和突破,LLM 大模型工程师这一新兴职业应运而生,他们正成为推动 AI 进步的关键力量,对于传统软件工程师来说,了解并迈向这一领域,或许将开启一段充满机遇与挑战的职业新征程。 2025年10月2日 192000 AI产业动态 AI在线强化学习实现“实践式学习”,斯坦福团队助力7B小模型性能大幅提升,表现超越GPT-4o 斯坦福团队推出AgentFlow框架,通过在线强化学习让仅7B参数的小模型在流式协作中“边做边学”。该方法使模型在搜索、数学等10项任务中性能显著提升,部分表现甚至超越了GPT-4o等超大模型,证明了优化系统设计可突破模型规模限制。 2025年10月24日 206000 大模型工程 探秘AI智能体设计模式:从ReAct到LATS,深入剖析智能体的“大脑”构建术 AI智能体的设计模式围绕效率与灵活性展开:基础模式ReAct通过”思考-行动-观察”循环实现环境交互;Plan & Execute、ReWOO和LLM Compiler通过预规划和并行执行优化效率;反思架构赋予智能体自我改进能力;LATS实现多路径智能决策。这些模式为不同应用场景提供了关键设计思路。 2025年10月14日 142000 发表回复 您的邮箱地址不会被公开。 必填项已用 * 标注*昵称: *邮箱: 网址: 记住昵称、邮箱和网址,下次评论免输入 提交 Δ