說明
1、PaddleOCR是基于深度學習的ocr識別庫,中文識別精度相當還不錯,能夠應對大多數文字提取需求。
2、需要依次安裝三個依賴庫,shapely庫可能會受到系統的影響,出現安裝錯誤。
安裝命令
pip install paddlepaddle
pip install shapely
pip install paddleocr
代碼實現
ocr = PaddleOCR(use_angle_cls=True,)
# 輸入待識別圖片路徑
img_path = r"d:\Desktop\4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png"
# 輸出結果保存路徑
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores)
im_show = Image.fromarray(im_show)
im_show.show()
內容擴展:
簡介
PaddleOCR旨在打造一套豐富、領先、且實用的OCR工具庫,助力使用者訓練出更好的模型,并應用落地。
近期更新
- 2020.8.26 更新OCR相關的84個常見問題及解答,具體參考FAQ
- 2020.8.24 支持通過whl包安裝使用PaddleOCR,具體參考Paddleocr Package使用說明
- 2020.8.21 更新8月18日B站直播課回放和PPT,課節2,易學易用的OCR工具大禮包,獲取地址
- 2020.8.16 開源文本檢測算法SAST和文本識別算法SRN
- 2020.7.23 發布7月21日B站直播課回放和PPT,課節1,PaddleOCR開源大禮包全面解讀,獲取地址
- 2020.7.15 添加基于EasyEdge和Paddle-Lite的移動端DEMO,支持iOS和Android系統
特性
- 超輕量級中文OCR模型,總模型僅8.6M
- 單模型支持中英文數字組合識別、豎排文本識別、長文本識別
- 檢測模型DB(4.1M)+識別模型CRNN(4.5M)
- 實用通用中文OCR模型
- 多種預測推理部署方案,包括服務部署和端側部署
- 多種文本檢測訓練算法,EAST、DB、SAST
- 多種文本識別訓練算法,Rosetta、CRNN、STAR-Net、RARE、SRN
- 可運行于Linux、Windows、MacOS等多種系統
到此這篇關于python PaddleOCR庫用法及知識點詳解的文章就介紹到這了,更多相關python PaddleOCR庫的介紹內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- python3使用Pillow、tesseract-ocr與pytesseract模塊的圖片識別的方法
- python3光學字符識別模塊tesserocr與pytesseract的使用詳解
- python EasyOCR庫實例用法介紹
- python muggle_ocr庫用法及實例代碼
- python 如何做一個識別率百分百的OCR
- Python 實現任意區域文字識別(OCR)操作
- Python實現OCR識別之pytesseract案例詳解