消息来源频道

互联网从业者充电站

@https1024

频道28,610 位成员公开可见持续更新

互联网从业者专属内容多为技术、产品、设计、运营等不同话题内容；目标人群为程序员、设计师、产品经理、运营管理等不同职能。投稿/合作： @inside1024_bot 内容来源网络

成员规模28,610 位成员

在线情况待同步

消息总数32,672 条消息

浏览量总数4,264,086 次浏览

频道详情频道地址

2025/03/19 06:30

SmolDocling: 最小最强文档 OCR 模型开源！⚡️一款可全文档OCR的多模态视觉语言模型，256M参数，处理速度每页0.35秒
基于上能处理文档中的所有内容，布局识别、代码识别、公式识别、图表识别、表格识别、图形分类、标题对应、列表分组等
可以处理包含各种元素的复杂文档，比如科学论文、商业文档、专利以及表格等
支持批量处理，支持导出为Markdown、HTML、JSON等格式
模型: https://huggingface.co/ds4sd/SmolDocling-256M-preview