首页 > 范文大全 > 正文

省字当头 心仪文字快速抓

开篇:润墨网以专业的文秘视角,为您筛选了一篇省字当头 心仪文字快速抓范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

平时看视频、幻灯片和PDF格式的电子书时,总有一些文字是我们所需要的。如果文字较少,我们可以将它们逐一打下来,如果文字较多,这样的方法就很悲催了。所以这里我们提供了几个非常高效的方法,希望能对有此需要的朋友有所帮助。

快速抓取对话框或窗口中的文字

对话框和窗口中经常有我们需要的文字,这时,我们可以借助AquaDesktop这款工具来将其抓取下来。

第一步:下载解压后,双击wText.exe文件运行程序。程序会在系统托盘区添加一个图标,右击该图标,在出现的右键菜单中选择“捕获助手”,打开相应的对话框,选择“文本”项,单击“下一步”按钮,在接下来的界面中,根据自己的需要,选择好要捕捉的选项,如“矩形区域的文本”、“单个词语”或“窗口的全部文本”等(笔者这里选择的是“矩形区域的文本”项),选择完毕,单击“下一步”按钮(如图1)。

第二步:单击“捕获”按钮,拖动鼠标选定好要捕捉的区域,该区域中的文字即会被捕捉下来。然后在出现的菜单中选择“点击复制文本”命令,将抓取到的文字复制到剪切板中,随后粘贴到需要的地方即可。

快速抓取视频或图片中的文字

识别图片或视频中的文字,说白了就是OCR识别,不过,我们通常所见的OCR识别工具,如“汉王OCR图片识别”和“清华紫光OCR”等,识别时,需要先将要识别的图片导入到程序中,而且其本身并不支持视频识别功能,操作起来比较麻烦。其实我们完全可以用“文通慧视”这款绿色的工具,简化识别流程。

第一步:下载解压后,双击其中的WtSign32.reg进行注册,然后执行“文字识别.exe”运行程序,此时屏幕上方会出现一个相应的工具条。使用图片浏览工具打开要截取文字的图片,单击工具条中的“慧视屏幕”按钮,这时,鼠标会变成“+”字形。按下鼠标左键选取图片上要截取的区域,在随后出现的对话框中,分别选择“内容”为“文本”、“背景”为“自动”、语言为“简体”,单击“确定”按钮。相应的文字即会被识别出来并显示到记事本中(如图2),然后将其保存或复制到需要的地方即可。

第二步:视频文字的截取方法类似。在播放器中暂停相应画面,然后打开“屏幕识别”对话框,勾选下方的“视频识别”项,然后拖动鼠标框选视频播放画面中的文字区域,单击“识别”按钮,很快就可抓取到播放画面中的文字。

快速提取PPT中的文字

PPT幻灯片中的内容主要分标题、文本和备注三部分,根据要提取的内容不同,我们可采取两种不同的方法。

实例1:利用PPT自身功能完成

如果幻灯片中的内容只包含标题、文本,或者你只想提取这两部分内容,且你目前使用的是Office 2010及其以后的版本,可利用PPT自身的功能完成。

启动要提取文字的PPT文档,切换到“文件”标签,在出现的菜单中选择“另存为”,打开“另存为”对话框,保存文件为“大纲/RTF文件”类型(如图3),最后双击这个RTF文件,系统会默认使用Word将其打开,对其中的内容进行编辑后将其保存成Word文档即可。

实例2:利用专用工具完成

如果你使用的不是Office 2010或以后的版本,而且要提取的内容包括PPT中的备注,则可借助“幻灯片文字提取程序”来完成。

第一步:关闭要转换的PPT文档,同时打开一个空白的PPT文档和Word文档,安装并运行程序,此时,屏幕上会出现一个对话框,要求我们关闭当前打开的PPT和Word文档,不管他(否则无法完成转换),单击“确定”按钮关闭该对话框,进入程序主界面。

第二步:在资源管理器中找到要转换的PPT文档,用鼠标将其拖拽到程序主界面的文本框中,单击“开始”按钮(如图4),软件就会自动打开每一页幻灯片,依次复制标题、文本框和备注中的文字内容,并按原来的顺序粘贴到Word窗口中。通常整个转换过程只需一两分钟,转换后的Word文档,程序会以“XXX.ppt.Convertor.doc”(其中“XXX”为原文档名)的命名方式,将其存到PPT文档所在的目录下。

批量抓取PDF中的文字

显然,用上面我们提到的“文通慧视”,照样能够抓取PDF文档中的文字,不过,这仅仅限于要抓取的文字较少的情况下,有些时候,我们需要抓取整个PDF文档中的文字,这时,我们可用ABBYYFineReader来达到目的。

第一步:安装并运行程序,单击工具栏中的“新建任务”按钮,打开相应的对话框,选择左侧的“常用”项,然后在右侧选择“文件(PDF/图像)至Microsoft Word”项(如图5),打开“打开图像”对话框,选择需要识别的PDF文件。

第二步:软件会自动打开该文档的每一个页面并进行识别,同时给出识别进度。识别完成,将自动打开Word文档,并以与原PDF文档相同的版式,显示出识别的内容,如文字、图片。对其中的内容进行编辑,编辑完毕,直接将其保存成Word格式,整个提取过程即告结束了。