當(dāng)前位置：首頁 > news >正文

netcore做網(wǎng)站推廣文章

news 2025/7/2 7:28:08

netcore做網(wǎng)站,推廣文章,yum安裝wordpress,西安seo技術(shù)培訓(xùn)班一、介紹 Tesseract是一款由Google贊助的開源OCR。 pytesseract是python包裝器，它為可執(zhí)行文件提供了pythonic API。 Tesseract 已經(jīng)有 30 年歷史，開始它是惠普實驗室的一款專利軟件，在2005年后由Google接手并進(jìn)一步開發(fā)和完善。Tesseract支…

一、介紹

Tesseract是一款由Google贊助的開源OCR。 pytesseract是python包裝器，它為可執(zhí)行文件提供了pythonic API。

Tesseract 已經(jīng)有 30 年歷史，開始它是惠普實驗室的一款專利軟件，在2005年后由Google接手并進(jìn)一步開發(fā)和完善。Tesseract支持多種語言文字的檢測和識別，包括中文、英語、德語、法語、意大利語等多種主要語言，同時也支持針對特定場景或應(yīng)用的領(lǐng)域OCR開發(fā)。

Tesseract基于機(jī)器學(xué)習(xí)技術(shù)，使用了多層神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)(SVM)等算法進(jìn)行文字特征提取和識別。同時，Tesseract通過圖像預(yù)處理、二值化、斑點去除和邊框檢測等多個環(huán)節(jié)優(yōu)化頁面處理流程，并且提供了多種字體、大小、旋轉(zhuǎn)角度和噪聲等挑戰(zhàn)場景下的訓(xùn)練數(shù)據(jù)集，使得識別精度可以獲得不錯的性能表現(xiàn)。

二、安裝

1、python安裝pytesseract

pip install pytesseract -i https://pypi.tuna.tsinghua.edu.cn/simple/

?2、python安裝Pillow圖片處理

pip install Pillow -i https://pypi.tuna.tsinghua.edu.cn/simple/

3、pytesseract需要和安裝在本地的tesseract-ocr.exe文件一起使用

tesseract-ocr.exe 下載地址?github

根據(jù)你的操作系統(tǒng)，選擇適當(dāng)?shù)陌姹具M(jìn)行下載和安裝。安裝勾選中文語言包

?4、系統(tǒng)變量path添加tesseract的安裝路徑xx:\Program Files\tesseract

系統(tǒng)變量path詳細(xì)添加,或者遇到?jīng)]有找到文件問題請看我的下一篇

三、使用

import pytesseract
from PIL import Image
#英文lang='eng'#中文:lang='chi_sim'#中英文混合：lang='chi_sim+eng'
text = pytesseract.image_to_string(Image.open(r"./img/a.jpg"), lang='eng')
print("英文：",text)

上述代碼假設(shè)你有一個名為"a.png"的圖像文件，它位于同級/img工作目錄下。通過image_to_string()函數(shù)，將圖像轉(zhuǎn)換為文本，并將結(jié)果存儲在text變量中。最后，可以使用print語句打印出識別的文本。

這就是使用Tesseract及pytesseract進(jìn)行OCR的基本步驟。你可以根據(jù)自己的需求進(jìn)一步探索和調(diào)整代碼。

查看全文

http://aloenet.com.cn/news/31832.html

国产亚洲精品福利在线无卡一,国产精久久一区二区三区,亚洲精品无码国模,精品久久久久久无码专区不卡

netcore做網(wǎng)站推廣文章

相關(guān)文章：