异构计算

  • 华为Flex:ai开源:异构算力池化技术如何重塑AI资源利用效率

    在AI产业高速发展的浪潮中,算力已成为驱动创新的核心燃料。然而,全球范围内普遍存在的算力资源利用率低下问题,正成为制约AI规模化应用的关键瓶颈。小模型任务独占整卡导致资源闲置,大模型任务单机算力不足难以支撑,大量缺乏GPU/NPU的通用服务器处于算力“休眠”状态——这种供需错配造成了严重的资源浪费。2023年11月21日,华为正式发布并开源AI容器技术Fle…

    2025年11月22日
    400
  • 从数据中心到工作站:KTransformers与LLaMA-Factory联手重塑千亿参数模型微调格局

    在人工智能技术快速迭代的浪潮中,大模型微调一直被视为连接通用智能与垂直应用的关键桥梁。然而,传统微调方法对计算资源的巨额需求,将千亿乃至万亿参数模型的定制化能力牢牢锁在数据中心内部,普通研究者和中小企业只能望而却步。如今,这一局面正被彻底改写——仅需2-4张消费级RTX 4090显卡,即可在本地工作站上对DeepSeek 671B、Kimi K2 1TB等超…

    2025年11月5日
    500