创建可搜索的 PDF 应用程序是将包含扫描文本或屏幕截图的 PDF 文件转换为包含文本的文件,使您能够在文本中搜索特定关键字并使用复制/粘贴从 PDF 中检索文本。 生成的文本作为可搜索的文本图层包含在 PDF 文件中。PDF 不可搜索的最常见原因是它是由扫描的文档制作的。扫描仪通常将文档的内容捕获为存储在 PDF 文件中的图像,以便将来识别文档的文本。将扫描的 PDF(发票、账单、收据、协议)转换为 “混合 PDF” 可搜索的 PDF 有许多增强功能。该应用程序非常适合识别照片中的打印文本,但不适用于手写文本。为了更准确地识别字符,值得选择文档的语言,这尤其有价值,因为这些语言的许多字符看起来很相似。 在这种情况下,创建可搜索的 PDF 文档将对你有所帮助,你有一本扫描的书籍或包含大量页面的文档,在这个 PDF 文档中保存格式、样式、图像、公式等对你来说很重要。如果你只应用 OCR 技术,格式就会损坏,书中的图片将被完全忽略,但是有了这个应用程序,你将获得数字化印刷文献和 OCR(文本识别)的所有好处) 技术。
以高质量识别文档图像中的文本的简单方法
保留页面上的文本位置
Hybrid PDF 看起来和原来的一样
支持 29 种及更多语言
对文档图像进行预处理以提高准确性
保留 PDF 文档的原始设计,同时允许在 PDF 文档中复制或搜索文本
如何使 PDF 可搜索
打开免费在线可搜索 PDF 网站
在文件放置区域内单击以上传 PDF 个文件或拖放 PDF 个文件
您最多可以为该操作上传 10 个 PDF 个文件
为识别文本设置要执行的语言
点击 “识别” 按钮。您的 PDF 文件将上传、识别并作为 pdf 文件提供
可搜索之后,结果文件的下载链接将立即可用
您也可以将 PDF 文件的链接发送到您的电子邮件地址
请注意,文件将在 24 小时后从我们的服务器中删除,下载链接将在此时段之后停止工作
常問問題
❓ 我怎样才能让 PDF 可搜索?
首先,您需要添加一个用于识别的文件:拖放您的 PDF 文件或在白色区域内单击以选择文件并指定文档的语言。然后点击 “识别” 按钮。当 PDF 文档的识别完成后,您可以下载结果文件。