任务详情
1、开发“pdf处理程序”,提供一个调用接口;2、该接口输入为“英文pdf输入文件”;3、接口识别英文pdf输入文件页面布局(分栏、分段、位置、字体、字号、颜色、样式)、图片、公式、表格、图表、文本(标题、目录、正文、页眉页脚、符号、参考文献)4、接口将识别内容输出到“word格式中间文件”和“json格式中间文件”,pdf中图片原样导出到json格式中间文件相同路径;5、输出的word格式中间文件的内容、样式要和英文pdf输入文件保持一致;6、输出的json格式中间文件需要记录英文pdf输入文件被识别出来的完整信息和导出的图片文件信息;7、接口基于输出的json格式中间文件、输出的图片,继续后续处理,并输出和英文pdf输入文件内容、样式原样还原的“英文pdf输出文件”。