【PDF快速看图】批量提取表格
工程行业有着大量的、多页的表格:
- 成百上千的化工单线图的材料表
- 公路图纸密密麻麻的路基土石方计算表
- 招标文件中的工程量清单表
将这些表格提取到Excel中一直是工程人最重要且头痛的工作之一,PDF快速看图推出了「批量提取表格」,大大提升了提取表格的效率,同时兼顾提取的准确率。快来看看教程吧~
先看动图:
工程量表:
管道材料表:
详细教程:
1、首先确认软件已经升级到了最新版本,软件下载链接:https://pdf.everdrawing.com/
2、打开一个多页在同一位置都有表格的PDF
3、点击菜单栏“OCR”按钮的下拉功能“批量提取表格”
4、框选需要提取的表格范围,为了兼容其他页的表格长短不一的情况,可以尽可能将表格框选得大一些,但不要框选到无关信息
5、框选完成后,弹出批量提取表格弹窗,在弹窗中设置批量提取表格的各个设置
5.1、页面范围:可以选择全部或页码范围
5.2、无表格线:针对无表格线或表格线不全的情况,可以勾选此选项来忽略已有表格线,并可以绘制列分隔线来保证分列准确
5.2.1、点击绘制列分隔线后,在框选区域内容,点击鼠标左键绘制列分隔线,此时可以按住Ctrl键,放大图纸,以更精确地绘制分隔线
5.2.2、如果添加的列分隔线不准确,可以点击框选范围左下角的“删除”或“移动”按钮,来删除或移动已有的列分隔线,删除或移动完成后,点击“添加”按钮,继续回到添加列分隔线状态,列分隔线绘制完成后,可以浏览其他页查看(注意:只能在单页模式下查看其他页的框选范围和列分隔线,双页模式和连续模式下无法查看)
5.3、按图像识别文字:如果识别结果出现乱码或特定语言文字丢失,可以勾选此选项。勾选后,将忽略PDF本身的文字,全部都使用OCR识别文字
5.4、提取结果增加页码:勾选此选项,将在提取的表格左边增加页码列
5.5、提取结果增加书签:勾选此选项,将在提取的表格左边增加书签列
5.6、导出:根据提取结果形式需求进行选择,如果勾选“导出到Excel的不同页签”,则每页将创建一个Excel页签,如果勾选“按顺序导出到一个Excel的同一个页签”,则将各页提取的表格按先后顺序提取到一个页签中
5.7、输出路径:默认为桌面,可以选择路径,另外可以修改提取后Excel表格的名称
5.8、提取后打开文件:勾选后将在提取完成后打开文件
6、设置完成批量提取表格后,点击“开始提取”,即弹出批量提取表格的进度条
7、耐心等待表格提取完成(页数较多的表格,提取时间可能较长)。
8、提取完成后,进度条会自动关闭,如果之前勾选了“提取后打开文件”,则会自动打开提取的表格,如果之前没有勾选了“提取后打开文件”,则可以在设置的输出路径中找到提取出的Excel
9、打开Excel后,可以对提取出的内容做后续处理,如校核与数据二次整理等
注意事项:
1、“批量提取表格”支持批量框选提取一个信息或内容(如图名、图号、管线号等),可以配和“提取结果增加页码”功能,进行信息提取,然后在Excel中使用VLOOKUP函数进行匹配整理
2、为了兼容各页的表格长短不一的情况,在框选表格时,可以尽可能将表格框选得大一些,但不要框选到无关信息
3、勾选“无表格线”,将忽略原有的所有表格线
4、“绘制列分隔线”功能,需在勾选“无表格线”的情况下才能使用
5、如果识别结果出现乱码或特定语言文字丢失,可以勾选“按图像识别文字”,勾选此选项将忽略PDF本身的文本信息,直接使用OCR信息
6、提取时间与PDF页数有一定的关系,一般页数越多,提取的时间越长
7、如果提取结束后出现以下弹窗,则说明在对应的页码没有提取到信息,可以选中复制页码,逐页查看校核
扫码进入「提取文字与表格(OCR)交流群」,分享软件使用心得