科教网| 中国科教第一门户网
当前位置:   首页 > 行动教育 > 正文

扫描或图片版PDF文档的编辑

行动教育
来源: 标签:文档图片 2016-03-07 18:15:47
拿到一份图片或扫描版的PDF文件,如果想要对其进行编辑修改该怎么办?当然首先想到的方法就是一个字一个字的通过键盘敲击出来,但这仅限于对短篇文档而言,如果遇到一篇包含几百页乃至上千页内容的PDF文档,我们唯一可以考虑的方便就只能是先对文档进行OCR处理,然后进行编辑
拿到一份图片或扫描版的PDF文件,如果想要对其进行编辑修改该怎么办?当然首先想到的方法就是一个字一个字的通过键盘敲击出来,但这仅限于对短篇文档而言,如果遇到一篇包含几百页乃至上千页内容的PDF文档,我们唯一可以考虑的方便就只能是先对文档进行OCR处理,然后进行编辑。

OCR ( Optical Character ecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。 当需要将纸质文档扫描并创建成电子文档或对现有的PDF 文档进行操作时, OCR 是最常用的一种方式。这里小编用的是一款国产的专业PDF处理软件——福昕风腾PDF套件(以下简称福昕PDF套件),它价格比Acrobat便宜,功能同样丰富。既可以满足您对PDF文档进行OCR处理的需求,也可以满足您对文档进行最终的编辑修改。

一、识别文本

打开基于纸质扫描或图片的PDF 文档时,福昕PDF 套件能自动检测到并弹出以下信息框,提示您是否进行 OCR。

(一)、在单个 PDF 文件中识别文本,请按以下步骤操作:
  1. 点击“主页” > “转换” > “ OCR” > “当前文件”, 在弹出的“选择 OCR 引擎”对话框中,指定识别范围。

../../../../ww2.sinaimg.cn/large/597c2677gw1etu9p31ha8j20at0bojse.jpg

1. 从语言列表中选择文档的语言,您也可以选择多种语言,为了OCR结果的准确性,建议文档中包含的语言都要选择;

2. 在“ 输出类型” 中,勾选“可搜索文本的图片”,这样您在查找文本时也可以搜索到文档中图片上的文本, 点击“确定”开始识别文本;

在文本识别过程中,会有进程条弹出显示文本识别的进程。在识别结束后,再执行搜索功能,您会发现原来在图片上或扫描文档中的文本也可以被搜索到。

注: 如果您在“输出类型”中选择了“可编辑文本”,原文档中的图片对象将被移除,只剩下从此图片中识别出的文本。

  (二)、在多个文件中识别文本时,您可以在OCR处理时选择“多个文件”,并在弹出的“ OCR 多个文件”对话框中,点击“添加文件”添加文件或文件夹, 并可以调整文件的识别顺序,其他同单个文件相同。

二、编辑文本

福昕PDF套件的编辑功能更加强大,它能够对任何PDF文档的文本、图像等内容进行各种编辑修改。扫描或图片版的PDF文档在进行了OCR处理后可直接用它进行编辑修改。您可以随心随欲添加和删除文本内容,且随着文本的添加、删除,段落框将根据情况自动变大、缩小,且自动在段落内重排文本及格式,您还可以按回车键开始新的一行。

稿件发布与内容纠错:18309209791

行风监督电话:15529092222

创意策划与直播服务:15667159999

违法与不良信息举报:kjw@kjw.cc 029-89696369

回顶部
关于我们| 网站地图 | | 新浪微博| 全国地市频道加盟热线:15529092222

Copyright © 2018 科教网(中国)All rights reserved   陕ICP备18015870号-1

科教网 - 中国科教产业第一门户网