腾讯混元开源440MB离线翻译模型,33种语言手机本地运行,效果超谷歌翻译

腾讯混元开源440MB离线翻译模型:33种语言手机本地运行,效果超越谷歌翻译

离线翻译正从“勉强可用”迈向“真正好用”的阶段。

对于出国旅行、跨境办公和阅读本地内容而言,一旦翻译工具依赖联网,在弱网无网或涉及隐私敏感的场景中,便极易掉链子。

然而,将翻译大模型真正塞入手机,又面临内存算力的双重制约:模型体积过大、推理速度太慢,都难以常驻本地运行。

为攻克这一难题,腾讯混元团队近日开源了一套硬核解决方案:

他们推出了极致量化压缩版本的翻译模型Hy-MT1.5-1.8B-1.25bit,将支持33种语言的翻译大模型压缩至440MB

该模型无需联网,下载后即可在手机本地运行。官方测试显示,其翻译质量优于谷歌翻译。

腾讯混元开源440MB离线翻译模型,33种语言手机本地运行,效果超谷歌翻译

△ 高通骁龙865,8GB内存


基于混元翻译大模型Hy-MT1.5打造,翻译效果比肩商业翻译模型

Hy-MT1.5是腾讯混元团队研发的专业翻译大模型,原生支持33种语言、5种方言/民汉语言及1056个翻译方向。无论是常见的中英互译,还是法语、日语、阿拉伯语、俄语,乃至藏语、蒙古语等少数民族语言,它都能从容应对。

值得注意的是,1.8B版本的Hy-MT1.5 在翻译效果上已能与商业翻译API以及235B级的大模型相媲美。

在严格的评测基准中,其翻译质量不仅超越了谷歌翻译、百度翻译等主流系统,更证明了在高效优化下,轻量级模型也能展现出令人瞩目的翻译能力。

腾讯混元开源440MB离线翻译模型,33种语言手机本地运行,效果超谷歌翻译

但问题同样直接:原始的1.8B模型即使在FP16精度下,仍然占用3.3GB内存。对于手机中宝贵的存储空间而言,这依然太大、太慢,因此必须进行量化压缩。


极致量化压缩,把模型装进手机

量化压缩,简而言之,就是将模型原本用16位数字(16-bit)表示的参数,改用更低位的数字来存储。

这好比把一张高清照片压缩成缩略图,文件体积大幅减小,但核心内容依然清晰可辨。

针对不同手机用户,腾讯特别推出了2-bit与1.25-bit两种极致的量化压缩方案。

腾讯混元开源440MB离线翻译模型,33种语言手机本地运行,效果超谷歌翻译

2-bit模型:性能与质量的平衡(适用中高端机型)

2-bit模型采用了业界领先的拉伸弹性量化(SEQ)技术,将模型参数量化至{-1.5,-0.5,0.5,1.5},并结合量化感知蒸馏,在将模型体积压缩至574MB的同时,实现了几乎无损的翻译质量,效果超越上百GB的大模型。在支持Arm SME2技术的移动设备上,2-bit模型可实现更快速、更高效的推理。

腾讯混元开源440MB离线翻译模型,33种语言手机本地运行,效果超谷歌翻译

△ 2-bit模型在SME2及Neon内核的速度对比演示

1.25-bit模型:Sherry极致压缩(适用全系机型)

为达成极致的轻量化,腾讯推出了基于Sherry(稀疏高效三值量化)技术的1.25-bit模型。该技术方案已被NLP顶级学术会议ACL 2026录用。

Sherry压缩方案的核心逻辑在于“细粒度稀疏”策略:每4个模型参数中,3个最重要的用1-bit存储,1个用0存储,平均每个参数仅需1.25-bit。

腾讯混元开源440MB离线翻译模型,33种语言手机本地运行,效果超谷歌翻译

配合腾讯专为手机CPU设计的STQ内核,该方案实现了对SIMD指令集的适配。最终,3.3GB的原始模型被进一步压缩至440MB,可以轻松常驻后台,让内存紧张的普通手机也能顺畅进行高质量离线翻译。

FP16(八倍速)vs. 1.25-bit速度对比演示:

腾讯混元开源440MB离线翻译模型,33种语言手机本地运行,效果超谷歌翻译

△ 演示设备:高通骁龙888,8GB内存

本次开源不仅包含模型权重,腾讯混元团队还制作了一个实际可用的腾讯混元翻译Demo版,特别适配了“后台取词模式”。无论是在本地查看邮件还是浏览网页,混元翻译都能随叫随到。无需网络,无需订阅,完全本地处理、不涉及个人信息采集和上传,一次下载即可永久使用。

腾讯混元开源440MB离线翻译模型,33种语言手机本地运行,效果超谷歌翻译

所有模型权重、代码及技术报告均已全面开源(目前仅支持安卓体验Demo,后续正式版将添加对iOS等平台的支持)。

体验链接:
– Hugging Face(海外用户):https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/main/Hy-MT-demo.apk
– 魔搭社区(国内用户):https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/master/Hy-MT-demo.apk

模型下载:
– Huggingface(海外用户):
– 2-bit 模型权重:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit
– 2-bit 模型gguf:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF
– 1.25-bit 模型权重:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit
– 魔搭社区(国内用户):
– 2-bit 模型权重:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit
– 2-bit 模型gguf:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF
– 1.25-bit 模型权重:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit
– 1.25-bit 模型gguf:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF

技术报告:
– Sherry论文地址:https://arxiv.org/abs/2601.07892
– AngelSlim技术报告:https://arxiv.org/abs/2602.21233
– Hy-MT1.5技术报告:https://arxiv.org/abs/2512.24092

代码仓库:
– AngelSlim:https://github.com/tencent/AngelSlim


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/32877

(0)
上一篇 1小时前
下一篇 1小时前

相关推荐

  • 港大开源CLI-Anything:一条命令让任何软件变身AI Agent可操控工具,4天狂揽1.5万Star

    CLI-Anything:一条命令将软件源码转化为AI Agent可操控工具 香港大学团队近日开源了一个名为 CLI-Anything 的项目。该项目旨在通过一条命令,将任何拥有源代码的软件转化为AI Agent可以直接操控的命令行工具,无需手动编写API接口或配置浏览器自动化。 核心功能 其核心逻辑是构建一个全自动的七阶段流水线:1. 分析源码2. 设计命…

    2026年3月26日
    84200
  • AReaL v1.0发布:一键接入RL训练,OpenClaw等Agent框架迎来强化学习新纪元

    2026年开年,智能体(Agent)依然是全球AI领域最受关注的赛道之一。由OpenClaw(原Clawbot)掀起的Agent热潮持续发酵,其影响力甚至让“一人公司”的概念首次具备了现实落地的可能性。 近日,OpenClaw在GitHub上的Star数量已超越React和Linux,成为非资源/教程类开源软件项目中最为瞩目的存在。 从浏览器智能体到代码智能…

    2026年3月4日
    93900
  • iPhone 17 Pro跑400B大模型!Flash-MoE让端侧AI突破物理极限

    编辑|冷猫 有时候看到一些大模型项目,总会怀疑是不是真的有外星人在干预地球科技。 就比如今天这个。 刚看到这个 Demo 时确实有点想笑,已经很久没见过吐词如此缓慢的大模型了。观感上就像“闪电”老师。 尽管每秒只有 0.6 个 tokens 的输出速度,这依然是一项令人难以置信的成果。因为这是一个运行在 iPhone 17 Pro 上的 400B 大模型! …

    53分钟前
    400
  • GitHub宝藏库推荐:大模型应用、CEO生存指南、AI Agent实战与无代码开发全攻略

    01 大模型 APP 合集 这个开源项目汇集了大量现成的开源大模型应用 Demo 和脚手架,已在 GitHub 上获得超过 8 万 Star。 无论您希望构建一个能够解读 PDF 的机器人,还是创建一个能够自动联网查询资料、撰写报告的复杂 Agent 团队,这里几乎都能找到可直接参考的代码。 其优点在于,它不仅支持 OpenAI 的模型,还为 Anthrop…

    2026年1月2日
    54000
  • vphone-cli:在Mac上运行真实iOS系统,开发者调试神器

    vphone-cli:在 Mac 上运行真实 iOS 系统,开发者调试神器 在 Mac 上运行真正的 iOS 系统 vphone-cli 是一个新近开源但迅速流行的项目。它允许开发者在 Mac 上直接引导并启动一个虚拟的 iPhone 设备。需要强调的是,它并非模拟器,而是运行着真实的 iOS 系统。该项目基于苹果原生的 Virtualization 框架实…

    2026年3月15日
    97300