国产无码免费,人妻口爆,国产V在线,99中文精品7,国产成人无码AA精品一,制度丝袜诱惑av,久久99免费麻辣视频,蜜臀久久99精品久久久久久酒店
        訂閱
        糾錯
        加入自媒體

        使用Google的Tesseract和OpenCV構建光學字符識別(OCR)系統

        2020-06-04 10:02
        磐創AI
        關注


        截至今天,Tesseract可以檢測100多種語言,甚至可以處理從右到左的文本,例如阿拉伯語或希伯來語!難怪Google會將其用于移動設備,視頻和Gmail的圖像垃圾郵件檢測算法中的文本檢測。從版本4開始,Google對該OCR引擎進行了重大改進。Tesseract 4.0添加了新的OCR引擎,該引擎使用基于LSTM(長期短期記憶,https://www.analyticsvidhya.com/blog/2017/12/fundamentals-of-deep-learning-introduction-to-lstm/)  的神經網絡系統,這是解決序列預測問題的最有效解決方案之一。盡管它以前使用模式匹配的OCR引擎仍可作為舊代碼使用。將Tesseract下載(https://tesseract-ocr.github.io/tessdoc/Home.html) 到系統后,可以使用以下命令從命令行輕松運行它(https://tesseract-ocr.github.io/tessdoc/Command-Line-Usage.html):tesseract <test_image> <output_file_name> -l <language(s)> --oem <mode> --psm <mode>

        你可以更改Tesseract配置以獲得最適合你的圖像的結果:語言(-l) : 使用Tesseract可以檢測一種或多種語言OCR引擎模式(-oem): 如你所知,Tesseract 4具有LSTM和Legacy OCR引擎。根據它們的組合,有4種有效的操作模式

        頁面分割(–psm) : 可以根據圖像中的文本進行調整以獲得更好的結果

        Pyteseract但是,除了命令行方法之外,你還可以使用Pytesseract(https://github.com/madmaze/pytesseract) :Tesseract的Python包裝器。使用此功能,你可以通過編寫簡單的Python腳本使用Tesseract OCR輕松實現自己的文本識別器。你可以使用pip install pytesseract命令下載Pytesseract  。Pytesseract的主要功能是image_to_text(),它將圖像和命令行選項作為其參數:

        Tesseract面臨的挑戰是什么?Tesseract并不完美,這不是什么秘密。當圖像有很多噪聲或者語言的字體是Tesseract OCR沒有經過訓練的字體時,它的性能很差。其他條件(如文本的亮度或傾斜度)也會影響Tesseract的性能。然而,它是文本識別的一個很好的起點,具有低努力和高產出的特點。文本檢測的不同方法Tesseract假定輸入文本圖像是干凈的。不幸的是,許多輸入圖像將包含過多的對象,而不僅僅是干凈的預處理文本,因此,必須具有一個良好的文本檢測系統,該系統可以檢測隨后可以輕松提取的文本。文本檢測有幾種方法:使用OpenCV的傳統方式使用當代深度學習模型建立自己的自定義模型使用OpenCV進行文本檢測使用OpenCV進行文本檢測是經典的處理方式。你可以應用各種操作(https://www.analyticsvidhya.com/blog/2019/03/opencv-functions-computer-vision-python/) ,如圖像調整大小,模糊,閾值化,形態學操作等,以清理圖像。

        在這里,我們有按灰度,模糊度和閾值順序排列的圖像。完成此操作后,可以使用OpenCV輪廓檢測來檢測輪廓以提取數據塊:最后,你可以在預測文本的輪廓上應用文本識別:

        上面圖像中的結果是通過最少的預處理和輪廓檢測以及隨后使用Pytesseract進行文本識別實現的,顯然,輪廓并不是每次都檢測到文本。但是,使用OpenCV進行文本檢測仍然是一項繁瑣的任務,需要使用大量參數。同樣,它在泛化方面的表現也不好,更好的方法是使用EAST文本檢測模型。當代深度學習模型– EASTEAST是一種高效、準確的場景文本檢測器,是一種從自然場景圖像中檢測文本的深度學習模型,它非常快速和準確,因為它能夠以13.2fps的速度檢測720p圖像,f值為0.7820。該模型由一個完全卷積網絡和一個非最大抑制階段組成,用于預測單詞或文本行。但是,該模型不包括其他先前模型所涉及的可以優化模型的中間步驟,例如候選建議,文本區域形成和單詞劃分。你可以看一下作者在論文中提供的以下圖像,將EAST模型與其他先前模型進行了比較:

        <上一頁  1  2  3  下一頁>  
        聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

        發表評論

        0條評論,0人參與

        請輸入評論內容...

        請輸入評論/評論長度6~500個字

        您提交的評論過于頻繁,請輸入驗證碼繼續

        暫無評論

        暫無評論

          人工智能 獵頭職位 更多
          掃碼關注公眾號
          OFweek人工智能網
          獲取更多精彩內容
          文章糾錯
          x
          *文字標題:
          *糾錯內容:
          聯系郵箱:
          *驗 證 碼:

          粵公網安備 44030502002758號

          主站蜘蛛池模板: 国产VA网站| 99亚洲精品| 三成人免费看| 宁津县| 熟女在线播放| 亚洲综合社区| 国内精品久久人妻无码AV探花影视| 精品一区二区三区四区| 色综合网址你懂的| 黑人与亚洲av| 锦屏县| 狠狠干性视频| 国产成人av| 夜夜撸影院| 亚洲熟女字幕| av黄色| 九色视频丨PORNY丨丝袜| 99在线观看视频只有精品| 91热视频| 1024无码| 色偷偷噜噜噜亚洲男人| 成人无码一级A片在线| 国产精品久久久久电影| 天堂在线中文字幕| 岛国AV网站| 制服.丝袜.亚洲.中文.综合| 孝义市| 中文字幕一二三产区区别| 亚洲色情在线播放| 淄博市| AV成人小说| 亚洲精品播放| 国产成人精品麻豆| 冕宁县| 日日夜夜撸免费视频| 亚洲综合乱| 商水县| 91色在线观看| 婷婷综合久久| 不卡的无码AV| 精品福利导航|