AI产业动态

  • MOSS-TTS Family:模思智能发布全场景语音生成模型家族,实现高保真音色克隆与实时交互

    当一段语音不仅需要“像某个人”、“准确地读出每个字”,还需要在不同内容中自然切换说话方式,在几十分钟的叙述中持续稳定,在对话、角色、实时交互等不同形态下都能直接使用——单一的TTS模型,往往已经不够用了。 模思智能及OpenMOSS团队发布了MOSS-TTS Family,一套面向高保真、高表现力与复杂场景生成的开源语音生成模型家族。 MOSS-TTS Fa…

    2026年2月11日
    15400
  • 马斯克xAI创始团队半数出走:AI人才流失危机下的IPO挑战与Grok发展隐忧

    马斯克于2023年与另外11位联合创始人共同创办的xAI,如今已有6人离开。 最新消息,xAI联合创始人Jimmy Ba于周二宣布,他已经离开了这家AI初创公司。 Jimmy在社交媒体上写道:“这是我在xAI的最后一天。xAI的使命是推动人类提升卡尔达舍夫等级。我非常荣幸能在公司创立之初共同参与这一历程。由衷感谢@elonmusk将我们聚集在一起,开启了这段…

    2026年2月11日
    9900
  • AI深度研究赋能春节规划:美团LongCat大模型如何用本地生活数据解决实际难题

    春节将至,科技圈也弥漫着“年味”。AI领域动态频出:Kimi 2.5与Step 3.5 Flash刚刚发布,DeepSeek V4、GPT-5.3、Claude Sonnet 5、Qwen 3.5、GLM-5等模型也蓄势待发,技术迭代的速度令人目不暇接。 各大厂商在春节期间更是动作频频,红包活动、机器人亮相春晚,无不展现出志在必得的竞争态势。然而,密集的更新…

    2026年2月11日
    12000
  • 港大开源轻量AI助手nanobot:仅4000行代码,支持多平台与主流LLM,GitHub狂揽1.3万星

    香港大学数据科学实验室开源了名为 nanobot 的超轻量级个人 AI 助手项目。该项目高度注重代码可读性、研究友好性、快速启动以及易于集成多模型与多聊天通道。 项目开源不久,便在 GitHub 上获得了超过 1.3 万颗星标。 nanobot 的设计灵感来源于 Clawdbot。其代码库仅包含约 4000 行代码,相较于原版 Clawdbot 的约 43 …

    2026年2月11日
    45200
  • 陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

    最近,数学家、菲尔兹奖得主陶哲轩联合多位顶尖科学家与世界级奖项得主,共同发起创立了一家专注于人工智能与科学研究的基金会——SAIR。 在SAIR成立当天,陶哲轩阐述了该机构的使命:致力于探索新的科学研究范式。他表示:“作为联合创始人,我很高兴能够汇聚数学与各科学领域的顶尖研究者,共同探讨人工智能与新兴技术如何加速科学发现,并开启新的研究工作流程。” 这一举动…

    2026年2月11日
    9900
  • AI生成Mermaid代码的渲染难题:beautiful-mermaid工具如何让图表在终端中“活”起来

    现在用 AI 工具生成 Mermaid,已经成了很多人的日常。 无论是 ChatGPT、Claude,还是各类 Copilot 或 Agent,只需一句话,就能生成流程图、时序图或系统架构图的 Mermaid 代码——效率极高。 但很快会遇到一个现实问题: AI 把图“写”出来了,但你很难把它“好看地展示”出来。 问题不在生成,而在渲染 Mermaid 默认…

    2026年2月11日
    28500
  • 2026数据中心机房建设新纪元:算力适配、绿色低碳与智能协同的全流程方案

    2026年,随着“十五五”规划将“全国一体化算力网”纳入国家级基础设施体系,数据中心机房建设正式进入“算力适配、绿色低碳、智能协同、安全可控”的高质量发展新阶段。 本方案立足《算力互联互通行动计划》等最新政策要求,结合GB 50174-2017规范延伸适配及2026年技术迭代趋势,整合传统机房与微模块机房的建设经验,融入产业链全维度分析,提供兼具科学性、技术…

    2026年2月11日
    30400
  • 从零实现30篇奠基论文:用NumPy揭秘深度学习核心思想

    在深度学习领域,Ilya Sutskever 曾有一个广为流传的判断:如果真正读懂并理解 30 篇奠基性论文,基本可以掌握人工智能 90% 的核心思想。 这不是指记住公式或复现 benchmark,而是理解模型为什么要这样设计、训练为何能收敛、哪些假设是成立的、哪些只是工程妥协。 问题在于,这 30 篇论文并不“友好”。 大量的数学推导、符号化描述、与现实代…

    2026年2月10日
    8800
  • 突破GPU瓶颈:d-PLENA NPU架构实现扩散大模型采样2.53倍加速

    关键词:dLLMs、NPU、采样优化、d-PLENA、GEMM 扩散型大语言模型(dLLM)是一种融合了扩散模型迭代去噪特性的大语言模型,可实现并行 Token 生成。但其采样阶段展现出与以通用矩阵乘法(GEMM)为核心的 Transformer 层截然不同的计算特征。 Beyond GEMM-Centric NPUs: Enabling Efficient…

    2026年2月10日
    12300
  • AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

    Andrej Karpathy 是 AI 领域公认的大神。他是 OpenAI 的创始成员,之后被马斯克挖走,领导了特斯拉自动驾驶团队。离开特斯拉后,他回到 OpenAI 参与了 GPT-4 的后续研发。 现在,他成立了一家 AI 教育公司 Eureka Labs,并经常在 X 和 YouTube 上活跃。如果你想学习 AI,尤其是技术原理,Andrej Ka…

    2026年2月10日
    38300