国产无码免费,人妻口爆,国产V在线,99中文精品7,国产成人无码AA精品一,制度丝袜诱惑av,久久99免费麻辣视频,蜜臀久久99精品久久久久久酒店
        訂閱
        糾錯
        加入自媒體

        使用 OpenCV 構建文檔掃描儀

        2022-11-02 10:43
        磐創AI
        關注

        介紹

        在本文中,我們將使用 OpenCV 庫來開發 Python 文檔掃描器。

        OpenCV 的簡要概述: OpenCV 是一個開源庫,用于各種計算機語言的圖像處理,包括 Python、C++ 等。它可用于檢測照片(例如使用人臉檢測系統的人臉) 。

        我們的軟件應該能夠正確對齊文檔,檢測捕獲圖像的邊界,提升文檔的質量,并最終提供更好的圖像作為輸出。本質上,我們將輸入一個文檔,即用相機拍攝的未經編輯的圖像。OpenCV 將處理該圖像。

        我們的基本工作流程是:

        形態學運算邊緣和輪廓檢測識別角點轉變視角執行形態學操作

        形態學:是一系列圖像處理程序和算法,根據圖像的高度和寬度來處理圖片。最重要的是它們的大小,而不是它們的相對像素值排序。

        kernel = np.ones((5,5),np.uint8)

        img = cv2.morphologyEx(img, cv2.MORPH_CLOSE, kernel, iterations= 3)

        我們可以使用morphologyEx() 函數執行操作。Morphology 中的“close”操作與Erosion相同,在此之前是Dilation過程。

        我們將創建一個空白文檔,因為在處理邊緣時圖片里的內容會妨礙你,我們不想冒險刪除它們。

        從捕獲的圖像中刪除背景

        照片中非我們拍攝對象的部分也必須刪除。與裁剪圖像類似,我們將只專注于維護圖像所需的部分。可以使用GrabCut庫。

        GrabCut 在接收到輸入圖片及其邊界后,剔除邊界外的所有元素。

        為了利用 GrabCut 來識別背景,我們還可以為用戶提供手動設置文檔邊框的選項。

        不過,目前,GrabCut 將能夠通過從圖像的每個角落取 20 個像素作為背景來自動識別前景。

        mask = np.zeros(img.shape[:2],np.uint8)

        bgdModel = np.zeros((1,65),np.float64)

        fgdModel = np.zeros((1,65),np.float64)

        rect = (20,20,img.shape[1]-20,img.shape[0]-20)

        cv2.grabCut(img,mask,rect,bgdModel,fgdModel,5,cv2.GC_INIT_WITH_RECT)

        mask2 = np.where((mask==2)|(mask==0),0,1).astype('uint8')

        img = img*mask2[:,:,np.newaxis]

        這里的“rect”變量表示我們愿意分離的邊界。你可能會遇到部分背景進入線條內部的情況,但這是可以接受的。我們的目標是對象的任何部分都不應超出邊界。

        邊緣和輪廓檢測

        我們目前擁有一份與原始文件大小相同的空白文件。同樣,我們將進行邊緣檢測。我們將為此使用Canny函數。

        為了清理文檔的噪聲,我們還使用了高斯模糊

        (注意:Canny 函數僅適用于灰度圖像,因此如果圖像尚不存在,則將圖像轉換為灰度)。

        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

        gray = cv2.GaussianBlur(gray, (11, 11), 0)

        # Edge Detection.

        canny = cv2.Canny(gray, 0, 200)

        canny = cv2.dilate(canny, cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5, 5)))

        我們在最后一行放大了圖像。

        在此之后,我們可以繼續進行輪廓檢測:

        我們只會記錄最大的輪廓并在一個新的空白文檔上進行交互。

        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

        gray = cv2.GaussianBlur(gray, (11, 11), 0)

        # Edge Detection.

        canny = cv2.Canny(gray, 0, 200)

        canny = cv2.dilate(canny, cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5, 5)))

        識別角點

        我們將使用已經注意到的四個角對齊紙張。使用“ Douglas-Peucker ”方法和approxPolyDp()函數。

        con = np.zeros_like(img)

        # Loop over the contours.

        for c in page:

         # Approximate the contour.

         epsilon = 0.02 * cv2.arcLength(c, True)

         corners = cv2.approxPolyDP(c, epsilon, True)

         # If our approximated contour has four points

         if len(corners) == 4:

             break

        cv2.drawContours(con, c, -1, (0, 255, 255), 3)

        cv2.drawContours(con, corners, -1, (0, 255, 0), 10)

        corners = sorted(np.concatenate(corners).tolist())

        for index, c in enumerate(corners):

         character = chr(65 + index)

         cv2.putText(con, character, tuple(c), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 1, cv2.LINE_AA)

        標準化四點定位

        def order_points(pts):

           rect = np.zeros((4, 2), dtype='float32')

           pts = np.array(pts)

           s = pts.sum(axis=1)

           rect[0] = pts[np.argmin(s)]

           rect[2] = pts[np.argmax(s)]

           diff = np.diff(pts, axis=1)

           rect[1] = pts[np.argmin(diff)]

           rect[3] = pts[np.argmax(diff)]

           return rect.astype('int').tolist()

        尋找目的地坐標:

        最后一組坐標可以改變圖像的視角。如果從通常的視角以一定角度拍攝,這將很有幫助。

        (tl, tr, br, bl) = pts

        # Finding the maximum width.

        widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))

        widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))

        maxWidth = max(int(widthA), int(widthB))

        # Finding the maximum height.    

        heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))

        heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))

        maxHeight = max(int(heightA), int(heightB))

        # Final destination co-ordinates.

        destination_corners = [[0, 0], [maxWidth, 0], [maxWidth, maxHeight], [0, maxHeight]]

        透視變換

        源照片的坐標現在必須與我們事先發現的目標坐標對齊。完成此階段后,圖像看起來就像是從紙張的正上方拍攝的一樣。

        # Getting the homography.

        M = cv2.getPerspectiveTransform(np.float32(corners), np.float32(destination_corners))

        final = cv2.warpPerspective(orig_img, M, (destination_corners[2][0], destination_corners[2][1]), flags=cv2.INTER_LINEAR)

        現在很明顯,以一定角度拍攝的圖像現在已經被完美地掃描出來了。

        測試觀察

        已經在許多不同方向的照片上測試了這些代碼,你也可以這樣做。在每個樣例上,它都表現出色。

        即使圖像的背景是白色(即類似于頁面本身顏色的顏色),GrabCut 也有效且清晰地定義了邊界線。

        結論

        本教程教我們如何使用 OpenCV 快速輕松地創建文檔掃描儀。

        總結:

        上傳圖片后,執行了:

        1. 生成與原始文件高度和寬度相同的空白文檔的形態學操作

        2. 從圖像中刪除了背景。

        3. 檢測到圖像中的輪廓和邊界。

        4. 檢測到的圖像角點,以矩形的形式

        5. 變換圖像的透視圖(如果有)

        此文檔掃描儀的一些限制: 即使文檔的一部分在捕獲時位于邊界框架之外,該項目也應正常運行。但它也會導致不準確的透視變換。

        廣泛使用的文檔掃描儀應用程序采用了幾種深度學習算法,因為它們的結果更加徹底和準確。

               原文標題 : 使用 OpenCV 構建文檔掃描儀

        聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

        發表評論

        0條評論,0人參與

        請輸入評論內容...

        請輸入評論/評論長度6~500個字

        您提交的評論過于頻繁,請輸入驗證碼繼續

        暫無評論

        暫無評論

          掃碼關注公眾號
          OFweek人工智能網
          獲取更多精彩內容
          文章糾錯
          x
          *文字標題:
          *糾錯內容:
          聯系郵箱:
          *驗 證 碼:

          粵公網安備 44030502002758號

          主站蜘蛛池模板: 仪陇县| 久久99深爱久久99精品| 潼关县| 熟女视频亚洲| 精品九九在线| 亚洲岛国片| 建平县| caopor在线| 欧美老熟妇精品| 内射91| 亚洲日韩第2页| 喀喇| 精品熟女| 伊人69| 国产色AV| 亚洲综合社区| 波密县| 青久视频| 欧美人妻少妇| 永新县| 2025精品视频| 亚色网站| 仙桃市| 无码18禁成人免费| 国产?成人?无码| 平武县| 久久精品网| 免费看无码网站成人A片| 久久婷婷影院| 三p免费视频| 亚洲综合社区| 91网在线| 色中色AV| 久久99视频| 内射在线播放| 琼结县| 中文字幕有码无码| 国产精品???A片在线观看| 成人亚洲| 临桂县| 91热视频|