AI产业动态

MOSS-TTS Family：模思智能发布全场景语音生成模型家族，实现高保真音色克隆与实时交互

当一段语音不仅需要“像某个人”、“准确地读出每个字”，还需要在不同内容中自然切换说话方式，在几十分钟的叙述中持续稳定，在对话、角色、实时交互等不同形态下都能直接使用——单一的TTS模型，往往已经不够用了。模思智能及OpenMOSS团队发布了MOSS-TTS Family，一套面向高保真、高表现力与复杂场景生成的开源语音生成模型家族。 MOSS-TTS Fa…

2026年2月11日

154000

AI产业动态

马斯克xAI创始团队半数出走：AI人才流失危机下的IPO挑战与Grok发展隐忧

马斯克于2023年与另外11位联合创始人共同创办的xAI，如今已有6人离开。最新消息，xAI联合创始人Jimmy Ba于周二宣布，他已经离开了这家AI初创公司。 Jimmy在社交媒体上写道：“这是我在xAI的最后一天。xAI的使命是推动人类提升卡尔达舍夫等级。我非常荣幸能在公司创立之初共同参与这一历程。由衷感谢@elonmusk将我们聚集在一起，开启了这段…

2026年2月11日

99000

AI产业动态

AI深度研究赋能春节规划：美团LongCat大模型如何用本地生活数据解决实际难题

春节将至，科技圈也弥漫着“年味”。AI领域动态频出：Kimi 2.5与Step 3.5 Flash刚刚发布，DeepSeek V4、GPT-5.3、Claude Sonnet 5、Qwen 3.5、GLM-5等模型也蓄势待发，技术迭代的速度令人目不暇接。各大厂商在春节期间更是动作频频，红包活动、机器人亮相春晚，无不展现出志在必得的竞争态势。然而，密集的更新…

2026年2月11日

120000

AI产业动态

港大开源轻量AI助手nanobot：仅4000行代码，支持多平台与主流LLM，GitHub狂揽1.3万星

香港大学数据科学实验室开源了名为 nanobot 的超轻量级个人 AI 助手项目。该项目高度注重代码可读性、研究友好性、快速启动以及易于集成多模型与多聊天通道。项目开源不久，便在 GitHub 上获得了超过 1.3 万颗星标。 nanobot 的设计灵感来源于 Clawdbot。其代码库仅包含约 4000 行代码，相较于原版 Clawdbot 的约 43 …

2026年2月11日

452000

AI产业动态

陶哲轩领衔SAIR：AI for Science的正确路径与学术界深度参与之道

最近，数学家、菲尔兹奖得主陶哲轩联合多位顶尖科学家与世界级奖项得主，共同发起创立了一家专注于人工智能与科学研究的基金会——SAIR。在SAIR成立当天，陶哲轩阐述了该机构的使命：致力于探索新的科学研究范式。他表示：“作为联合创始人，我很高兴能够汇聚数学与各科学领域的顶尖研究者，共同探讨人工智能与新兴技术如何加速科学发现，并开启新的研究工作流程。” 这一举动…

2026年2月11日

99000

AI产业动态

AI生成Mermaid代码的渲染难题：beautiful-mermaid工具如何让图表在终端中“活”起来

现在用 AI 工具生成 Mermaid，已经成了很多人的日常。无论是 ChatGPT、Claude，还是各类 Copilot 或 Agent，只需一句话，就能生成流程图、时序图或系统架构图的 Mermaid 代码——效率极高。但很快会遇到一个现实问题： AI 把图“写”出来了，但你很难把它“好看地展示”出来。问题不在生成，而在渲染 Mermaid 默认…

2026年2月11日

285000

AI产业动态

2026数据中心机房建设新纪元：算力适配、绿色低碳与智能协同的全流程方案

2026年，随着“十五五”规划将“全国一体化算力网”纳入国家级基础设施体系，数据中心机房建设正式进入“算力适配、绿色低碳、智能协同、安全可控”的高质量发展新阶段。本方案立足《算力互联互通行动计划》等最新政策要求，结合GB 50174-2017规范延伸适配及2026年技术迭代趋势，整合传统机房与微模块机房的建设经验，融入产业链全维度分析，提供兼具科学性、技术…

2026年2月11日

304000

AI产业动态

从零实现30篇奠基论文：用NumPy揭秘深度学习核心思想

在深度学习领域，Ilya Sutskever 曾有一个广为流传的判断：如果真正读懂并理解 30 篇奠基性论文，基本可以掌握人工智能 90% 的核心思想。这不是指记住公式或复现 benchmark，而是理解模型为什么要这样设计、训练为何能收敛、哪些假设是成立的、哪些只是工程妥协。问题在于，这 30 篇论文并不“友好”。大量的数学推导、符号化描述、与现实代…

2026年2月10日

88000

AI产业动态

突破GPU瓶颈：d-PLENA NPU架构实现扩散大模型采样2.53倍加速

关键词：dLLMs、NPU、采样优化、d-PLENA、GEMM 扩散型大语言模型（dLLM）是一种融合了扩散模型迭代去噪特性的大语言模型，可实现并行 Token 生成。但其采样阶段展现出与以通用矩阵乘法（GEMM）为核心的 Transformer 层截然不同的计算特征。 Beyond GEMM-Centric NPUs: Enabling Efficient…

2026年2月10日

123000

AI产业动态

AI大神Andrej Karpathy开源92个高质量信息源：从nanoGPT到RSS订阅，打造深度学习知识体系

Andrej Karpathy 是 AI 领域公认的大神。他是 OpenAI 的创始成员，之后被马斯克挖走，领导了特斯拉自动驾驶团队。离开特斯拉后，他回到 OpenAI 参与了 GPT-4 的后续研发。现在，他成立了一家 AI 教育公司 Eureka Labs，并经常在 X 和 YouTube 上活跃。如果你想学习 AI，尤其是技术原理，Andrej Ka…

2026年2月10日

383000