一区二区三区中文国产亚洲_另类视频区第一页_日韩精品免费视频_女人免费视频_国产综合精品久久亚洲

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > EasyOCR的使用

EasyOCR的使用

來源:千鋒教育
發(fā)布人:千鋒
時(shí)間: 2023-12-28 18:29:29 1703759369

001-OCR光學(xué)文字識(shí)別

一、OCR簡介

OCR(Optical Character Recognition,光學(xué)文字識(shí)別)是指電子設(shè)備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程;即針對印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。

各種場景都有OCR的身影,我們可以在任何地方使用到OCR。Python中常見的OCR有EasyOCR、PaddleOCR等,接下來我們以EasyOCR為例,演示其如何使用。

二、EasyOCR使用

EasyOCR是一個(gè)免費(fèi)開源的OCR模塊,其有自己的一系列的訓(xùn)練好的模型,借助這些模型,我們就可以識(shí)別各種場景下的文字。

Github鏈接:https://github.com/JaidedAI/EasyOCR

EasyOCR官網(wǎng):https://www.jaided.ai/easyocr/

首先我們先來安裝OCR:

Windows:pip install easyocr;Mac/Linux:pip3 install easyocr

安裝完成以后

我們直接寫代碼即可

1.導(dǎo)入easyocr模塊

import easyocr

 2.實(shí)例化Reader類

Reader類中有幾個(gè)參數(shù)我們需要手動(dòng)修改

lang_list:告訴它我們要識(shí)別的語言,以列表的形式傳參,可以一次傳遞多種語言,但并非所有語言都可以一起使用,截止到2022年12月19日,已經(jīng)支持80+種語言。這是目前支持的語言的鏈接:https://www.jaided.ai/easyocr/。我們這里寫的ch_sim是簡體中文,en是英文。

gpu:會(huì)讓你選擇使用cpu驅(qū)動(dòng)還是gpu驅(qū)動(dòng),使用gpu驅(qū)動(dòng)識(shí)別速度會(huì)更快一些,但是所要配置的環(huán)境也更復(fù)雜,如果有興趣,可以自行研究一下,這里我們就使用cpu,將gpu改為False。

download_enabled:easyocr第一次運(yùn)行時(shí)會(huì)先在線下載模型數(shù)據(jù),但是鑒于網(wǎng)絡(luò)不好,大部分人下載時(shí)都會(huì)發(fā)生錯(cuò)誤,所以將download_enabled改為False,我們手動(dòng)去下載模型數(shù)據(jù)。

model_storage_directory:這個(gè)參數(shù)是指定模型數(shù)據(jù)的引用路徑,默認(rèn)情況下在Windows系統(tǒng)中存放在C:\Users\用戶名\.EasyOCR\model中,在Mac/Linux系統(tǒng)中存放在~/.EasyOCR/model中,我們可以通過修改model_storage_directory參數(shù)自行指定模型數(shù)據(jù)的路徑,我這里就直接指定相對路徑為./model。

注意:

除此之外還有很多其他參數(shù),詳情請見源碼。

 

reader = easyocr.Reader(
lang_list=['ch_sim', 'en'],
gpu=False,
download_enabled=False,
model_storage_directory='./model'
)

 

 1.調(diào)用readtext方法

實(shí)例化Reader類以后,調(diào)用readtext方法讀取圖片。

readtext方法中有一個(gè)參數(shù)叫做image,把圖片傳給它即可。image參數(shù)可以接收圖片路徑、圖片的numpy數(shù)組或者圖片的字節(jié)流對象。一般情況下我們直接傳遞圖片路徑即可,除非有要求要針對圖片做一些特殊處理。

result = reader.readtext(image='圖片')
print(result)

 三、模型下載

剛剛我們說將download_enabled參數(shù)改為False,要去手動(dòng)下載模型數(shù)據(jù),這是模型數(shù)據(jù)下載地址:https://www.jaided.ai/easyocr/modelhub/。

ocr1

下載圖中框選中的三個(gè)即可,下載下來為zip壓縮包,一定要解壓縮,我們需要的是其中的后綴名為pth的文件,并將其移動(dòng)到我們自己創(chuàng)建的**model**文件夾中。因?yàn)槲覀円鑫淖肿R(shí)別就一定要有CRAFT,我們識(shí)別的大部分為簡體中文和英文,所以下載zh_sim_g2和english_g2。當(dāng)然,如果你要識(shí)別其他語言,請?jiān)俅握移渌Z言的模型數(shù)據(jù)。

四、圖片

在此提供幾張圖片,供大家測試。

OCR2

按照官方的說法,準(zhǔn)確率在90%以上,但是碰到識(shí)別不出來或者識(shí)別錯(cuò)誤的概率還是蠻大的。

ocr3


tags: EasyOCR
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
最小二乘法(Least Squares)

一、最小二乘法概念與用途知悉最小二乘法是一種常用的數(shù)學(xué)方法,用于通過擬合數(shù)據(jù)點(diǎn)來找到最佳擬合曲線或平面。其核心思想是最小化觀測數(shù)據(jù)點(diǎn)與...詳情>>

2023-12-28 18:23:03
如何抓取 API 接口中的數(shù)據(jù)

一、API接口概述今天我們來講一種更快捷的獲取數(shù)據(jù)的方式,通過API數(shù)據(jù)接口抓取數(shù)據(jù)。API接口是負(fù)責(zé)傳遞數(shù)據(jù)的,在現(xiàn)今已存在的網(wǎng)站中,除了極...詳情>>

2023-12-28 18:12:00
Web應(yīng)用程序安全:如何確保數(shù)據(jù)安全?

Web應(yīng)用程序安全:如何確保數(shù)據(jù)安全?Web應(yīng)用程序已經(jīng)成為現(xiàn)代互聯(lián)網(wǎng)的核心部分。Web應(yīng)用程序的發(fā)展和演化使得用戶可以通過連接到數(shù)據(jù)和信息資...詳情>>

2023-12-28 00:53:09
5種常見的網(wǎng)絡(luò)安全威脅,以及如何應(yīng)對!

網(wǎng)絡(luò)安全問題越來越嚴(yán)重,惡意攻擊和黑客入侵事件頻繁發(fā)生。針對不同類型的網(wǎng)絡(luò)安全威脅和攻擊手段,我們需要采取不同的安全措施。本文將介紹5...詳情>>

2023-12-28 00:47:53
確保個(gè)人設(shè)備安全:關(guān)于反病毒軟件的一切

確保個(gè)人設(shè)備安全:關(guān)于反病毒軟件的一切隨著互聯(lián)網(wǎng)的普及,個(gè)人設(shè)備的安全問題日益凸顯。惡意軟件、病毒、木馬、蠕蟲等威脅,輕則影響設(shè)備運(yùn)行...詳情>>

2023-12-28 00:44:21
快速通道