初学者从PDF中提取文本和图像的指南

了解多种方法可以从PDF文件中提取图像和文本

PDF文件很好,用于在跨平台交换格式化的文件以及不使用相同软件的人与人之间,但有时我们需要将文本或图像从PDF文件中扣除并在网页,Word处理文档中使用它们,PowerPoint演示文稿,或桌面发布软件。

取决于您的需求和安全选项设置在单个PDF中,您可以在PDF文件中提取文本,图像或两者的几个选项。选择最适合您的选项。

组装在大立方体形状的小多彩多姿的块在蓝色背景
本矿工/盖蒂图像
  • 使用Adobe Acrobat Professional。如果您拥有完整版Adobe Acrobat,而不仅仅是免费的Acrobat Reader,您可以从PDF中提取单个图像或所有图像以及以各种格式导出,例如EPS,JPG和TIFF。要从Acrobat DC中的PDF中提取信息,请选择工具>出口PDF.并选择一个选项。要提取文本,请将PDF导出到单词格式或富文本格式,然后从包含以下几个高级选项中选择:

    • 保留流动的文本
    • 保留页面布局
    • 包括评论
    • 包括图像
    Acrobat Pro导出MS Word的选项。
  • 使用Acrobat Reader复制和粘贴PDF。如果您有Acrobat Reader,您可以复制PDF文件的一部分到剪贴板并将其粘贴到另一个程序中。对于文本,只需突出显示PDF中的文本部分并按Ctrl.+C复制它。

    然后打开一个单词处理程序,例如微软Word.,并按Ctrl.+V.粘贴文本。使用图像,单击图像以选择它,然后将其复制并粘贴到支持图像的程序中,使用相同的键盘命令。

  • 在图形程序中打开PDF文件。当图像提取是您的目标时,您可以在一些插图程序中打开PDF,例如较新版本Photoshop.,coreldraw或Adobe Illustrator,并保存图像以进行编辑和使用桌面发布应用程序。

    从Photoshop中从PDF中提取图像。
  • 使用第三方PDF提取软件工具。几个独立的实用程序和插件可用于将PDF文件转换为HTML,同时保留页面布局,提取和转换PDF内容以将PDF内容转换为向量图形格式,并提取用于文字处理,演示文稿和桌面发布软件的PDF内容。这些工具提供不同的选项,包括批量提取/转换,整个文件或部分内容提取以及多个文件格式支持。这些主要是商业和共享软件的基于Windows的实用程序。

  • 使用在线PDF提取工具。使用在线提取工具,您不必下载或安装软件。每个人都可以提取多少变化。例如,ExtractPDF.com.,将最多14MB的文件上传到大小或为PDF提供URL,以提取图像,文本或字体。

    ExtractPDF网站。
  • 拍屏幕截图在PDF中拍摄图像的屏幕截图之前,在屏幕上尽可能在其窗口中放大它。在PC上,选择PDF窗口的标题栏,然后按alt.+PRTSCN.。在Mac上,按命令+转移+4.并使用似乎拖动的光标选择要捕获的区域。

此页面是否有帮助?