模型微调 - 鲸林向海

小模型革命：为什么1B-7B参数模型正在重塑AI工程未来

一套深度实战的 22 篇工程系列：用 1B–7B 模型打造快速、低成本、私密且强大的 AI 系统。使用 AI 生成的图像四个月前，我真的觉得小模型是个笑话。并非没用——只是…有限。适合做演示、做研究挺有意思，但离生产可用还差得远。在我看来，“真正的 AI 工程”就该用巨型基础模型和一堆 A100。如果你不在烧算力，你算什么在做 AI？这个信念在一个…

2026年1月10日

221000

大模型训练

8元跑通RL全流程！潞晨云微调SDK：算法与Infra解耦，1人顶替整支团队

大模型下半场的战火，已经从“暴力预训练”烧向了“后训练”战场。无论是OpenAI o1的推理突破，还是DeepSeek-R1靠强化学习（RL）实现的性能飞跃，都释放了一个明确信号：决定模型天花板的，不再只是算力堆砌，而是更精准的微调和RL迭代。但现实很骨感——复杂的分布式基建、高昂的显卡租金、繁琐的架构调优，像一道道高墙，把无数算法工程师挡在了“炼…

2026年1月7日

154000

大模型工程

劈开教育“不可能三角”：揭秘AI名师如何实现千人千面个性化教学

教育领域正迎来一个AI应用新物种—— 其讲课节奏、语气与互动，都展现出高度的自然感。更重要的是，它不仅能“像老师一样讲课”，还能为每一位学员提供一对一的个性化教学。这位AI导师，出自一家名为“与爱为舞”的AI原生应用企业。自年初上线以来，已累计为百万级用户提供学习陪伴与一对一讲解服务。教育行业，向来是一个“规模、质量、成本”的不可能三角。既要实现千人…

2025年12月30日

239000

大模型安全

EnchTable：无需重训练的模型安全对齐框架，破解微调后安全能力退化难题

在人工智能模型快速发展的当下，微调（Fine-tuning）已成为提升模型在特定任务上性能的关键技术。然而，最近的研究揭示了一个严峻问题：模型的微调过程会严重削弱其安全对齐（Safety Alignment）能力。这意味着，随着模型在特定领域能力的增强，其安全防护机制反而可能被削弱，导致模型在应对恶意查询、越狱攻击时表现脆弱。这种“能力越强越危险”的现象，已…

2025年11月19日

171000

AI产业动态

从数据中心到工作站：KTransformers与LLaMA-Factory联手重塑千亿参数模型微调格局

在人工智能技术快速迭代的浪潮中，大模型微调一直被视为连接通用智能与垂直应用的关键桥梁。然而，传统微调方法对计算资源的巨额需求，将千亿乃至万亿参数模型的定制化能力牢牢锁在数据中心内部，普通研究者和中小企业只能望而却步。如今，这一局面正被彻底改写——仅需2-4张消费级RTX 4090显卡，即可在本地工作站上对DeepSeek 671B、Kimi K2 1TB等超…

2025年11月5日

181000

大模型工程

9张图速览大模型核心技术：从Transformer到AI Agent的全面解析

在 AI 工程领域，RAG（检索增强生成）、LLM（大语言模型）和 AI Agent（智能体）是当前最核心的技术方向。本文通过 9 张可视化图表，系统性地解析其核心概念、技术差异与应用场景，旨在帮助读者快速把握技术脉络。 1. Transformer 与混合专家 (Mixture of Experts) 混合专家（MoE）是一种改进Transformer模…

2025年5月8日

200000