轻量化模型
-
腾讯混元HunyuanOCR:轻量化端到端OCR专家模型的技术突破与产业影响
近日,腾讯混元大模型团队正式发布并开源了HunyuanOCR模型,这是一款参数仅为1B的商业级开源OCR专用视觉语言模型。该模型采用原生ViT与轻量级LLM结合的创新架构,在文本检测识别、复杂文档解析等感知能力方面优于所有公开方案,并在信息抽取、文字图像翻译等语义任务中表现卓越。在ICDAR 2025 DIMT挑战赛(小模型赛道)中荣获冠军,同时在OCRBe…
-
LimiX:以2M参数颠覆表格数据建模,清华团队破解深度学习结构化瓶颈
在人工智能的浪潮中,大语言模型(LLM)凭借其在文本生成、代码编写和多模态推理方面的卓越表现,已成为通用智能的代名词。然而,当我们把目光投向现实世界的关键系统——电网调度、用户画像、通信日志等,这些领域的核心数据往往以结构化表格的形式存在。令人意外的是,在这个看似“简单”的领域,包括LLM在内的现代深度学习模型却频频失手,其性能在多数真实场景下仍难以超越XG…