视觉压缩

AI产业动态

视觉压缩革命：DeepSeek-OCR如何颠覆AI信息处理范式

在人工智能领域，信息表示与处理效率一直是核心挑战。DeepSeek-OCR的开源发布，不仅是一个技术工具的更新，更可能标志着AI架构范式的根本性转变。这项技术提出的“上下文光学压缩”概念，正在重新定义我们对多模态AI的理解边界。从技术原理层面分析，DeepSeek-OCR的核心突破在于证明了视觉表示在信息压缩上的显著优势。在长上下文解码任务中，该模型在保持…

2025年11月14日
201000
AI产业动态

视觉压缩革命：VIST框架如何让大语言模型像人类一样高效阅读长文本

在人工智能领域，大语言模型（LLM）的上下文长度扩展与计算效率之间的矛盾日益凸显。NeurIPS 2025会议上，南京理工大学、中南大学、南京林业大学联合研究团队提出的VIST（Vision-centric Token Compression in LLM）框架，通过创新的视觉压缩机制，为大语言模型的长文本处理提供了突破性解决方案。这一技术路径与近期备受关注…

2025年11月10日
232000