複製鏈接
請複製以下鏈接發送給好友

識別錯誤

鎖定
識別錯誤,當語音識別器或手寫識別器未按預期解釋語音或手寫時發生的錯誤。
中文名
識別錯誤
平    台
pc及其他智能
屬    性
計算機術語
性    質
計算學科

識別錯誤PDF文件的識別

(1)文件可以直接識別的(以文本形式保存的PDF文件):安裝acrobat7專 業版,注意不是acrobatreader,直接另存為rtf文件(識別整個文件),或者選擇工具欄上的文字選擇按鈕,然後選擇文字區域,然後複製到word等中。
(2)文件不能直接識別的(以圖片形式保存的PDF文件):安裝office2003然後在打印機裏面會增加MicrosoftOfficeDocumentImageWriter打印機,然後將PDF文件打印到此打印機,選擇打印形成的文件的保存位置,然後會自動形成一個MDI文件,並且自動用MicrosoftOfficeDocumentImage打開此文件,然後選擇“工具”菜單下的“使用ocr識別文本”,識別完成後,在選擇“工具”下的,“將文本發送到word”,最後將把整個PDF文件識別輸出到word文件中。
注意:MicrosoftOfficeDocumentImage可以非常準確的全文件識別轉化中文、英文、表格,但是無法將圖形輸出到word,而是把文件中的所有圖形單獨形成一個個獨立的圖片文件,放在相同位置的一個相同名稱的文件夾中,因此可用snagit軟件將圖形打開,然後複製到word中。(所有的識別軟件都不能很好的處理圖形的識別問題,MicrosoftOfficeDocumentImage的這種處理方法已經是非常好的解決這個問題了。)(3)加密的Pdf文件:先下載解密軟件(4)繁體pdf文件:用(2)的方法識別到word後,用word中的“工具”--“語言”---“中文繁簡轉換”

識別錯誤caj文件的識別

(1)局部文字識別:直接使用caj瀏覽的ocr
(2)全文件識別:打印到MicrosoftOfficeDocumentImageWriter打印機,後面和上面的(2)操作一樣
(3)博碩論文全文下載:在線閲讀博碩論文,待可以看到最後一頁後,不要關閉caj瀏覽器,到caj安裝目錄下cache中找到一個較大的文件,拷貝到其他位置即可。然後使用(2)全部轉化為word。

識別錯誤超星文件的識別

(1)局部文字識別:直接使用超星瀏覽器(的ocr)
(2)全文件識別:打印到MicrosoftOfficeDocumentImageWriter打印機,後面和上面的(2)操作一樣,要注意的是,超星打印功能有點區別,因為超星是目錄和全文分開的,所以打印時,需要分別把目錄和正文識別到word中,在合併到一起。打印時要填入打印頁碼從1到最後一頁,不要選擇打印全部。此外在打印選項中,還要將頁面比例設成真實大小,而不是整寬。注意:識別速度比其他格式要慢很多,請保持耐心,但是最後當你看到輕鬆的生成全本書的word版本時,你會欣喜若狂的,呵呵。我的試驗結果是一本280頁的書,識別需要幾分鐘的時間。
(3)超星相對比較麻煩一些,如果還有問題,可以先把超星打印成完整的pdf文件,然後在用1、的方法轉成word

識別錯誤其他情況下的識別

使用snagit軟件將任何形式的文字可以變成圖片,例如使用snagit將屏幕拷貝成圖片,然後右鍵點擊圖片文件,用microsoftOfficeDocumentImage打開圖形,其他和(2)一樣。
注意:其他的各種識別軟件請不要在用,因為要麼只能識別中文,要麼只能識別英文,要麼不能識別整個文件,要麼不能識別屏幕拷貝圖像,要麼識別誤差很大,要麼不能識別表格,要麼需要註冊,要麼識別速度很慢,要麼使用不便(和word結合不緊),這些軟件包括:紫光ocr,萬方pdfocr,尚書,漢王,ScanSoftPDFConverter,pdf2word,以及各種被推薦的軟件等等,我都裝過,現在都像LJ一樣刪除了。只要安裝了acrobat專業版,snagit,office2003,現在你可以完美的做任何事,最重要的是這幾個軟件很好得到。
針對一些問題的補充:
經過一些試驗,發現microsoftOfficeDocumentImage存在一些不穩定的問題,例如在用caj打印到MicrosoftOfficeDocumentImageWriter打印機時,發現用caj5.5版本比較快,(caj5.5不能加升級補丁),而caj5.0有時出現假死機
另外頁面顯示大時,轉化的識別率較高。
如果頁數多的文件,包括超星,如果有問題,可以分多次轉化。