經由掃描生成的 PDF 僅內含頁面的影像。Power PDF 可將此種純影像的 PDF 文件轉變為可搜尋的檔案。使用光學字元辨識 (Optical Character Recognition,OCR) 即可辦到。透過校對可使該處理程序的正確度更加提升。
製作可搜尋的 PDF
在 [首頁] > [轉換] 按一下 [製作可搜尋的 PDF]。
如可搜尋的 PDF 轉換設定所述,提供偏好設定。
校對功能可提高 OCR 生成的文字的正確性。辨識度決定了識別出的各個文字和詞彙的信任度。其會列出有疑義的詞彙供確認。校對程式面板 (A) 頂端會出現一張詞彙或字串的圖片。下一個面板 (B) 顯示的是目前的處理方式,而底端面板 (C) 則會列出說明或字典所生成的替代選項。使用右邊的按鈕來保留目前的處理方式,或是從建議選項中擇一。如果都不適合,輸入正確的單字或字串到可疑文字文字方塊中,並按確定。按一下文件就緒 (D) 在到達文件結尾之前結束校對流程。按一下頁面就緒 (E) 來跳過目前頁面上剩餘的文字,移動至下一頁。選取顯示文件中已辨識出的文字核取方塊 (F),讓文字圖層保持可見,原始影像圖層變淡,可在某些狀況下提高可讀性。
右方的按鈕可讓使用者對建議的處理方式進行處理:
略過:若目前的建議正確無誤,即選擇此項。校對程式會移動至下一個有疑義的字彙。
略過全部:選擇此項即表示接下來有疑義的同樣詞彙全部都會被判定為正確。
非文字:OCR 程序可能會將藝術線條或圖表轉換為文字。使用此按鈕可去除掉建議的文字。
新增:接受目前選擇的處理方式,並將之加入目前的字典
變更:接受目前選擇的處理方式。
全部變更:接受目前選擇的處理方式,並以其作為所有接下來相符項目的處理方式。
若所有的建議均不正確,請在編輯框內輸入正確的處理方式,再按一下 [變更] 或 [全部變更]。
可在 [檔案] > [選項] > [文件] > [可搜尋的 PDF 文件] 之中設定製作可搜尋的 PDF 時是否要執行校對。
在此處可選擇 OCR 處理程序的語言。內建有多種語言的字典支援功能。可以指定使用者字典來輔助內建字典,也可以不使用內建字典而改以使用者字典協助識別語言。
若未使用自動校對,則可在 [首頁] > [製作可搜尋的 PDF 文件] > [校對程式] 對特定檔案進行校對。
也可以使用 PDF Create 製作可搜尋的 PDF。