如果純影像 PDF 檔案中有文字或者是從包含文字的影像檔建立 PDF 檔案,將無法搜尋這些文件中的內容。若要讓這些檔案變得可以搜尋,應該使用 OCR 來提取其中的文字。可搜尋的 PDF 文件會呈現頁面影像,但是也會將可辨識的文字放置在個別圖層上,每個文字字元參照其對應的影像。如此即可搜尋 PDF。若要存取必須以準確原始外觀加以封存的文件內容,可搜尋的 PDF 特別適用。
附註
如果選取了 [可搜尋的 PDF],那麼只有在輸入檔案中沒有偵測到可存取的文字圖層時,才會執行 OCR 程序。找到文字圖層時,就會使用該圖層建立可搜尋的一般 PDF,而不需要執行 OCR。即使停用了 [可搜尋的 PDF] 也是一樣的情形。
您可以使用 Create Assistant,將純影像 PDF 檔案或各種影像檔案類型轉換為可搜尋的 PDF 文件。
在 [可搜尋的 PDF 轉換設定] 對話方塊中可以設定 OCR 語言。
祕訣
如需支援檔案類型清單,請參閱 Create Assistant。
Create Assistant 另外提供一個名稱為「可搜尋的 PDF」的設定檔,但是您也可以勾選 [可搜尋的 PDF] 核取方塊,使用其他設定檔建立可搜尋的 PDF。
使用 Create Assistant 中的「可搜尋的 PDF」設定檔
在 [Create Assistant 設定檔] 選取方塊中選取 [可搜尋的 PDF]。
開啟一或多個欲轉換為可搜尋的 PDF 的檔案。
按一下 [設定檔] 按鈕,檢查 [PDF Create 設定檔] 對話方塊中的設定。[可搜尋的 PDF ] 核取方塊會自動選取。保留這個設定,如有必要,變更其他設定 (例如,保全、浮水印等)。
按一下 [設定] 按鈕,顯示 [可搜尋的 PDF 轉換設定] 對話方塊。選取來源文件的語言,然後關閉對話方塊。按一下 [確定] 以關閉 [PDF Create 設定檔] 對話方塊。
按一下 [開始建立 PDF] 工具。若以 [為每個輸入文件建立一個 PDF] 選擇多個檔案,並且將 [查詢檔案] 名稱設為儲存選項,則每個產生的 PDF 檔案會分別顯示 [另存新檔] 對話方塊。
若要使用其他設定檔建立可搜尋的 PDF
在 [Create Assistant 設定檔] 選取方塊中,選取一個設定檔並載入檔案。
按一下 [設定檔] 按鈕。
在 [PDF Create 設定檔] 對話方塊中,選取 [可搜尋] 核取方塊。
按一下 [設定] 按鈕,顯示 [可搜尋的 PDF 轉換設定] 對話方塊。選取來源文件的語言,然後按一下 [確定]。
在 [PDF Create 設定檔] 對話方塊中,檢查並視需要變更其他設定 (例如,保全、浮水印等)。按一下 [確定] 後開始按照上述方式建立。
祕訣
若要使用 MRC 壓縮產生可搜尋的 PDF,請啟用這兩個核取方塊。在這種情形下,如果按一下 [設定] 按鈕,將會顯示 [可搜尋的 MRC PDF 轉換設定] 對話方塊。
當您在 Power PDF 中開啟純影像 PDF 檔,或包含純影像頁面的 PDF 檔時,可以設定讓程式自動偵測此設定 ([檔案] > [選項] > [文件] > [可搜尋的 PDF 文件])。若要這麼做,請取消選取相關的核取方塊 (預設會勾選此方塊)。若啟用提示功能,程式會詢問您要將文件製作成:
可搜尋的 PDF:這個選項會保留原始頁面影像,因此會保留外觀,但是新增可搜尋的文字圖層。
一般 PDF:這個選項會產生文字並保留圖片,但是會捨棄原始頁面影像。
PDF 表單:這會在檔案上執行 Form Typer 以建立現用表單控制項。
PDF 檔案會維持原狀。
如需詳細資訊,請參閱關於編輯 PDF 文件。
附註
在 Power PDF 中,可以將純影像 PDF 或含部分純影像的 PDF 轉換成可搜尋的 PDF,方法是使用 [首頁] > [轉換] 中的 [製作可搜尋的 PDF] 命令。您可以在 [檔案] > [選項] > [文件] > [可搜尋的 PDF 文件] 下設定此轉換功能。選擇只要在含部分純影像的頁面上執行 OCR,或是在所有頁面上執行,若選擇後者,OCR 結果會取代之前在 PDF 中的所有文字圖層內容。另一個選項允許在有文字層但因非標準編碼而無法使用時執行 OCR。可以校對生成的文字,以提高 OCR 處理程序的正確度。