MinerU 是一款通用的开源工具,用于从 PDF 文档、网页和电子书中提取数据。
MinerU 的主要功能包括移除页眉和页脚等不必要的元素、保留原始文档的结构以及将方程转换为 LaTeX 格式。
该工具支持 CPU 和 GPU,因此适用于 Windows、Linux 和 macOS 等不同操作系统。
MinerU 通过在输出中保留图像、表格和其他重要格式元素,提供高质量的内容提取。
🧬 https://github.com/opendatalab/MinerU
#tools #AI
MinerU 的主要功能包括移除页眉和页脚等不必要的元素、保留原始文档的结构以及将方程转换为 LaTeX 格式。
该工具支持 CPU 和 GPU,因此适用于 Windows、Linux 和 macOS 等不同操作系统。
MinerU 通过在输出中保留图像、表格和其他重要格式元素,提供高质量的内容提取。
🧬 https://github.com/opendatalab/MinerU
#tools #AI