办公自动化¶
1. Excel¶
2. PDF¶
-
PDFPlumber
PDFPlumber 用于提取 PDF 文件中信息。
-
Camelot
Camelot 用于提取 PDF 文件中信息,需要安装 CV2。
-
PDFMiner2019
PDFMiner 用于提取 PDF 文件中信息。
-
MagicPDF2019
Magic-PDF是一款将PDF转化为markdown格式的工具。支持转换本地文档或者位于支持S3协议对象存储上的文件。
-
MagicDoc
Magic-Doc 是一个轻量级、开源的用于将多种格式的文档(PPT/PPTX/DOC/DOCX/PDF)转化为 markdown 格式的工具。支持转换本地文档或者位于 AWS S3 上的文件
-
MagicHTML
Magic-Doc 提供了一套工具,能够轻松地从HTML中提取主体区域内容。无论您处理的是复杂的HTML结构还是简单的网页,这个库都旨在为您的HTML抽取需求提供一个便捷高效的接口。