pdf解析

您的位置：首页 > 任务详情

招标模式 pdf解析

雇主：mike
截止时间：2023-11-07
分类：程序开发

¥ 5000-10000 元

免责声明该外包需求信息来源于站外平台，本站仅提供公开信息部分字段展示与订阅服务，更多请查看免责声明。

任务详情

一、需求描述1、开发“pdf处理程序”，提供一个调用接口；2、该接口输入为“英文pdf输入文件”；3、接口识别英文pdf输入文件页面布局（分栏、分段、位置、字体、字号、颜色、样式）、图片、公式、表格、图表、文本（标题、目录、正文、页眉页脚、符号、参考文献）4、接口将识别内容输出到“word格式中间文件”和“json格式中间文件”，pdf中图片原样导出到json格式中间文件相同路径；5、输出的word格式中间文件的内容、样式要和英文pdf输入文件保持一致；6、输出的json格式中间文件需要记录英文pdf输入文件被识别出来的完整信息和导出的图片文件信息；6、接口基于输出的json格式中间文件、输出的图片，继续后续处理，并输出和英文pdf输入文件内容、样式原样还原的“英文pdf输出文件”。二、验收要求：1、交付识别、还原pdf的思路，进行讲解2、交付源码（代码格式规范，有良好的注释）3、不允许调用第三方接口4、项目可以使用开源解决方案5、项目中不能包含需要付费的第三方库6、接口运行环境为Linux7、开发语言限制在Python/C#/Java/PHP/C++中的任何一种，优先Python8、输出文件不能超过输入文件大小的1.5倍9、100M的pdf文件，处理时间不超过 2 分钟