SmolDocling: 最小最强文档 OCR 模型开源!⚡️一款可全文档OCR的多模态视觉语言模型,256M参数,处理速度每页0.35秒
基于上能处理文档中的所有内容,布局识别、代码识别、公式识别、图表识别、表格识别、图形分类、标题对应、列表分组等
可以处理包含各种元素的复杂文档,比如科学论文、商业文档、专利以及表格等
支持批量处理,支持导出为Markdown、HTML、JSON等格式
模型: https://huggingface.co/ds4sd/SmolDocling-256M-preview
基于上能处理文档中的所有内容,布局识别、代码识别、公式识别、图表识别、表格识别、图形分类、标题对应、列表分组等
可以处理包含各种元素的复杂文档,比如科学论文、商业文档、专利以及表格等
支持批量处理,支持导出为Markdown、HTML、JSON等格式
模型: https://huggingface.co/ds4sd/SmolDocling-256M-preview