網(wǎng)站代理合作百度推廣怎么做
📝個(gè)人主頁(yè)🌹:Eternity._
🌹🌹期待您的關(guān)注 🌹🌹
? 玩轉(zhuǎn)OCR
- 騰訊云智能結(jié)構(gòu)化識(shí)別
- 產(chǎn)品介紹
- 服務(wù)應(yīng)用
- 產(chǎn)品特征
- 行業(yè)案例
- 總結(jié)
騰訊云智能結(jié)構(gòu)化識(shí)別
騰訊云智能結(jié)構(gòu)化OCR產(chǎn)品分為基礎(chǔ)版與高級(jí)版,廣泛適用于各行業(yè),能精準(zhǔn)識(shí)別卡證、物流單據(jù)、工業(yè)標(biāo)簽、服務(wù)合同及醫(yī)療報(bào)告等多種文檔類型。即便面對(duì)版式靈活多變或中英文混合排版的挑戰(zhàn),該產(chǎn)品仍能保持卓越的識(shí)別精度。
通過(guò)運(yùn)用先進(jìn)的多模態(tài)大模型技術(shù),騰訊云OCR能夠智能建立鍵值對(duì)應(yīng)關(guān)系,并允許客戶根據(jù)自身需求定制個(gè)性化模板,從而顯著提高數(shù)據(jù)抓取與錄入的效率。 這一解決方案廣泛適用于政務(wù)事務(wù)處理、票據(jù)核銷流程、行業(yè)表單自動(dòng)化填寫(xiě)等多個(gè)業(yè)務(wù)場(chǎng)景。
產(chǎn)品介紹
背景:
在交通、物流、金融、零售等多個(gè)行業(yè)中,各類票據(jù)、表單、文檔、合同等文件普遍面臨版式布局復(fù)雜、中英文混合排版、票據(jù)混雜粘貼、印刷體與手寫(xiě)體并存、樣式多樣且差異顯著、英文字段解析難度高等一系列挑戰(zhàn)。這些痛點(diǎn)導(dǎo)致傳統(tǒng)的通用文字識(shí)別技術(shù)難以滿足企業(yè)對(duì)高精度識(shí)別的業(yè)務(wù)需求。
為了解決這些問(wèn)題,我們就需要使用智能結(jié)構(gòu)化:
- 智能結(jié)構(gòu)化融合了業(yè)界領(lǐng)先的深度學(xué)習(xí)技術(shù)、圖像檢測(cè)技術(shù)以及OCR大模型能力,能夠?qū)崿F(xiàn)不限版式的結(jié)構(gòu)化信息抽取。無(wú)論是固定卡證還是復(fù)雜的物流單據(jù),均可實(shí)現(xiàn)智能識(shí)別。
服務(wù)應(yīng)用
- 注冊(cè)并登錄騰訊云,通過(guò)實(shí)名認(rèn)證后,開(kāi)通服務(wù)
- 開(kāi)通服務(wù)后,我們可以進(jìn)入控制臺(tái),體驗(yàn)demo
使用文字識(shí)別服務(wù):
- 直接在文字識(shí)別體驗(yàn)Demo中體驗(yàn),智能結(jié)構(gòu)化(高級(jí)版)
代碼調(diào)用:
import json
import types
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.ocr.v20181119 import ocr_client, models
try:# 實(shí)例化一個(gè)認(rèn)證對(duì)象,入?yún)⑿枰獋魅腧v訊云賬戶 SecretId 和 SecretKey,此處還需注意密鑰對(duì)的保密# 代碼泄露可能會(huì)導(dǎo)致 SecretId 和 SecretKey 泄露,并威脅賬號(hào)下所有資源的安全性。以下代碼示例僅供參考,建議采用更安全的方式來(lái)使用密鑰,請(qǐng)參見(jiàn):https://cloud.tencent.com/document/product/1278/85305# 密鑰可前往官網(wǎng)控制臺(tái) https://console.cloud.tencent.com/cam/capi 進(jìn)行獲取cred = credential.Credential("SecretId", "SecretKey")# 實(shí)例化一個(gè)http選項(xiàng),可選的,沒(méi)有特殊需求可以跳過(guò)httpProfile = HttpProfile()httpProfile.endpoint = "ocr.tencentcloudapi.com"# 實(shí)例化一個(gè)client選項(xiàng),可選的,沒(méi)有特殊需求可以跳過(guò)clientProfile = ClientProfile()clientProfile.httpProfile = httpProfile# 實(shí)例化要請(qǐng)求產(chǎn)品的client對(duì)象,clientProfile是可選的client = ocr_client.OcrClient(cred, "", clientProfile)# 實(shí)例化一個(gè)請(qǐng)求對(duì)象,每個(gè)接口都會(huì)對(duì)應(yīng)一個(gè)request對(duì)象req = models.RecognizeGeneralTextImageWarnRequest()params = {"ImageUrl": "https://waizi.org.cn/uploadfile/201402/22/222111297.jpg"}req.from_json_string(json.dumps(params))# 返回的resp是一個(gè)RecognizeGeneralTextImageWarnResponse的實(shí)例,與請(qǐng)求對(duì)象對(duì)應(yīng)resp = client.RecognizeGeneralTextImageWarn(req)# 輸出json格式的字符串回包print(resp.to_json_string())except TencentCloudSDKException as err:print(err)
用于測(cè)試圖片:
識(shí)別結(jié)果:
Address: "XX市XX區(qū)XX號(hào)"
Angle: 0
Business: "XXXXXXXXXXXXXXXXXXXXXXXXXX、XXXXXXXX、XXXXXXXXXX、XXXXXXXX、XXXXXXXX、XXXXXXXXXX"
Capital: "萬(wàn)元整"
ComposingForm: ""
Electronic: false
IsDuplication: 1
Name: "XXXXXX公司"
NationalEmblem: true
Period: "0000年00月00日至0000年00月00日"
Person: "XXX"
QRCode: true
RecognizeWarnCode: [
]
RecognizeWarnMsg: [
]
RegNum: "000000000000000"
RegistrationAuthority: "XX省工商行政管理局"
RegistrationDate: "0000年00月"
RequestId: "5276ef57-3aa7-49f1-b064-dc6beb6a44e3"
Seal: true
SerialNumber: ""
SetDate: "0000年00月"
Title: "營(yíng)業(yè)執(zhí)照"
Type: "有限責(zé)任公司"
產(chǎn)品特征
產(chǎn)品體驗(yàn):
在采用騰訊云智能結(jié)構(gòu)化OCR產(chǎn)品的基礎(chǔ)與高級(jí)版本進(jìn)行營(yíng)業(yè)執(zhí)照識(shí)別時(shí),我深刻體會(huì)到其高效與精準(zhǔn)度。該產(chǎn)品能夠迅速且準(zhǔn)確地捕捉營(yíng)業(yè)執(zhí)照上的關(guān)鍵字段信息,涵蓋了統(tǒng)一社會(huì)信用代碼、公司名稱、主體類型、法定代表人、注冊(cè)資本、組成形式、成立日期、營(yíng)業(yè)期限以及經(jīng)營(yíng)范圍等多個(gè)重要細(xì)節(jié)。
行業(yè)案例
物流單據(jù)識(shí)別:
適用于各種版式不固定、版面復(fù)雜、中英文混排的場(chǎng)景,針對(duì)進(jìn)出口物流、貨代、進(jìn)出口貿(mào)易的單據(jù),完成高精度的結(jié)構(gòu)化識(shí)別,跨境貨代場(chǎng)景,快遞&快運(yùn)場(chǎng)景,國(guó)際貿(mào)易與采購(gòu)等等
票據(jù)單據(jù)識(shí)別:
用于企業(yè)員工發(fā)票報(bào)銷,通過(guò) OCR 技術(shù)提取各種紙質(zhì)發(fā)票、憑證上的發(fā)票號(hào)碼、金額、發(fā)票代碼等關(guān)鍵信息,支持?jǐn)?shù)據(jù)錄入和自動(dòng)核對(duì),減少人工校驗(yàn)成本。
總結(jié)
騰訊云通過(guò)持續(xù)的技術(shù)研發(fā)和創(chuàng)新,不斷提升智能結(jié)構(gòu)化OCR技術(shù)的準(zhǔn)確性和效率。
其OCR技術(shù)能夠高效地將身份證、名片等卡證類和票據(jù)類的印刷體識(shí)別,也支持運(yùn)單等手寫(xiě)體識(shí)別,支持提供定制化服務(wù),可以有效地代替人工錄入信息轉(zhuǎn)化為可編輯、可搜索的數(shù)字文本,極大地便利了信息的處理和利用。而在給與用戶們的體驗(yàn)也很不錯(cuò),OCR將來(lái)定會(huì)為我們的生活帶來(lái)更大便利。