婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Python 實現任意區域文字識別(OCR)操作

Python 實現任意區域文字識別(OCR)操作

熱門標簽:汕頭電商外呼系統供應商 電銷機器人 金倫通信 鄭州智能外呼系統中心 北京外呼電銷機器人招商 云南地圖標注 400電話 申請 條件 賓館能在百度地圖標注嗎 crm電銷機器人 南京crm外呼系統排名

本文的OCR當然不是自己從頭開發的,是基于百度智能云提供的API(我感覺是百度在中國的人工智能領域值得稱贊的一大貢獻),其提供的API完全可以滿足個人使用,相對來說簡潔準確率高。

安裝OCR Python SDK

OCR Python SDK目錄結構

├── README.md
├── aip     //SDK目錄
│ ├── __init__.py  //導出類
│ ├── base.py   //aip基類
│ ├── http.py   //http請求
│ └── ocr.py   //OCR
└── setup.py    //setuptools安裝

支持Python版本:2.7.+ ,3.+

安裝使用Python SDK有如下方式:

如果已安裝pip,執行pip install baidu-aip即可。

如果已安裝setuptools,下載后執行python setup.py install即可。

代碼實現

下面讓我們來看一下代碼實現。

主要使用的模塊有

import os # 操作系統相關
import sys # 系統相關
import time # 時間獲取
import signal # 系統信號
import winsound # 提示音
from aip import AipOcr # 百度OCR API
from PIL import ImageGrab # 捕獲剪切板中的圖片
import win32clipboard as wc # WINDOWS 剪切板操作
import win32con # 這里用于獲取 WINDOWS 剪貼板數據的標準格式

第一步 這里的APP_ID,API_KEY,SECRET_KEY是通過登陸百度智能云后自己在OCR板塊申請的, 實現基本的OCR程序,可以通過圖片獲取文字。

""" 你的 APPID AK SK """
APP_ID = 'xxx'
API_KEY = 'xxx'
SECRET_KEY = 'xxx'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

""" 讀取圖片 """
def get_file_content(filePath):
 with open(filePath, 'rb') as fp:
  return fp.read()

""" 從API的返回字典中獲取文字 """
def getOcrText(txt_dict):
 txt = ""
 if type(txt_dict) == dict:
 for i in txt_dict['words_result']:
 txt = txt + i["words"]
 if len(i["words"])  25: # 這里使用字符串長度決定了文本是否換行,讀者可以根據自己的喜好控制回車符的輸出,實現可控的文本顯示形式
 txt = txt + "\n\n"
 return txt

""" 調用通用/高精度文字識別, 圖片參數為本地圖片 """
def BaiduOcr(imageName,Accurate=True):
 image = get_file_content(imageName)
 if Accurate:
 return getOcrText(client.basicGeneral(image))
 else:
 return getOcrText(client.basicAccurate(image))
 
""" 帶參數調用通用文字識別, 圖片參數為遠程url圖片 """
def BaiduOcrUrl(url): 
 return getOcrText(client.basicGeneralUrl(url))

第二步,實現快捷鍵獲取文字,將識別文字放入剪切板中,提示音提醒以及快捷鍵退出程序

""" 剪切板操作函數 """
def get_clipboard():
 wc.OpenClipboard()
 txt = wc.GetClipboardData(win32con.CF_UNICODETEXT)
 wc.CloseClipboard()
 return txt

def empty_clipboard():
 wc.OpenClipboard()
 wc.EmptyClipboard()
 wc.CloseClipboard()

def set_clipboard(txt):
 wc.OpenClipboard()
 wc.EmptyClipboard()
 wc.SetClipboardData(win32con.CF_UNICODETEXT, txt)
 wc.CloseClipboard()
 
""" 截圖后,調用通用/高精度文字識別"""
def BaiduOcrScreenshots(Accurate=True,path="./",ifauto=False):
 if not os.path.exists(path):
 os.makedirs(path)
 image = ImageGrab.grabclipboard()
 if image != None:
 print("\rThe image has been obtained. Please wait a moment!",end=" ")
 filename = str(time.time_ns())
 image.save(path+filename+".png")
 if Accurate:
 txt = getOcrText(client.basicAccurate(get_file_content(path+filename+".png")))
 else: 
 txt = getOcrText(client.basicGeneral(get_file_content(path+filename+".png")))
 os.remove(path+filename+".png")
 # f = open(os.path.abspath(path)+"\\"+filename+".txt",'w')
 # f.write(txt)
 set_clipboard(txt)
 winsound.PlaySound('SystemAsterisk',winsound.SND_ASYNC)
 # os.startfile(os.path.abspath(path)+"\\"+filename+".txt")
 # empty_clipboard()
 return txt
 else :
 if not ifauto:
 print("Please get the screenshots by Shift+Win+S!  ",end="")
 return ""
 else:
 print("\rPlease get the screenshots by Shift+Win+S !  ",end="")

def sig_handler(signum, frame):
 sys.exit(0)
 
def removeTempFile(file = [".txt",".png"],path="./"):
 if not os.path.exists(path):
 os.makedirs(path)
 pathDir = os.listdir(path)
 for i in pathDir:
 for j in file:
 if j in i:
 os.remove(path+i)

def AutoOcrFile(path="./",filetype=[".png",".jpg",".bmp"]):
 if not os.path.exists(path):
 os.makedirs(path)
 pathDir = os.listdir(path)
 for i in pathDir:
 for j in filetype:
 if j in i:
 f = open(os.path.abspath(path)+"\\"+str(time.time_ns())+".txt",'w')
 f.write(BaiduOcr(path+i))
 break

def AutoOcrScreenshots():
 signal.signal(signal.SIGINT, sig_handler)
 signal.signal(signal.SIGTERM, sig_handler)
 print("Waiting For Ctrl+C to exit ater removing all picture files and txt files!")
 print("Please get the screenshots by Shift+Win+S !",end="")
 while(1):
 try:
 BaiduOcrScreenshots(ifauto=True)
 time.sleep(0.1)
 except SystemExit:
 removeTempFile()
 break
 else :
 pass
 finally:
 pass

最終運行函數 AutoOcrScreenshots 函數便可以實現了:

if __name__ == '__main__':
 AutoOcrScreenshots()

使用方法

使用 Windows 10 系統時,將以上代碼放置在一個 .py 文件下,然后運行便可以使用Shift+Win+S快捷鍵實現任意區域截取,截取后圖片將暫時存放在剪切板中,程序自動使用Windows API獲取圖片內容,之后使用百度的OCR API獲取文字,并將文字放置在剪切版內存中后發出提示音。

使用者則可以在開啟程序后,使用快捷鍵截圖后靜待提示音后使用Ctrl+V將文字內容放置在自己所需的位置。

補充:Python 中文OCR

有個需求,需要從一張圖片中識別出中文,通過python來實現,這種這么高大上的黑科技我們普通人自然搞不了,去github找了一個似乎能滿足需求的開源庫-tesseract-ocr:

Tesseract的OCR引擎目前已作為開源項目發布在Google Project,其項目主頁在這里查看https://github.com/tesseract-ocr,

它支持中文OCR,并提供了一個命令行工具。python中對應的包是pytesseract. 通過這個工具我們可以識別圖片上的文字。

筆者的開發環境如下:

macosx

python 3.6

brew

安裝tesseract

brew install tesseract

安裝python對應的包:pytesseract

pip install pytesseract

怎么用?

如果要識別中文需要下載對應的訓練集:https://github.com/tesseract-ocr/tessdata,下載”chi_sim.traineddata”,然后copy到訓練數據集的存放路徑,如:

具體代碼就幾行:

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import pytesseract
from PIL import Image

# open image
image = Image.open('test.png')
code = pytesseract.image_to_string(image, lang='chi_sim')
print(code)

OCR速度比較慢,大家可以拿一張包含中文的圖片試驗一下。

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • 基于Python實現對PDF文件的OCR識別
  • 初探利用Python進行圖文識別(OCR)
  • 如何使用Python進行OCR識別圖片中的文字
  • python3安裝OCR識別庫tesserocr過程圖解
  • Python文字截圖識別OCR工具實例解析
  • Python圖像處理之圖片文字識別功能(OCR)
  • python實現百度OCR圖片識別過程解析
  • Python基于百度AI實現OCR文字識別
  • Python3實現騰訊云OCR識別
  • 小白學Python之實現OCR識別

標簽:西寧 梅州 文山 昆明 石家莊 錫林郭勒盟 浙江 懷化

巨人網絡通訊聲明:本文標題《Python 實現任意區域文字識別(OCR)操作》,本文關鍵詞  Python,實現,任意,區域,文字,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python 實現任意區域文字識別(OCR)操作》相關的同類信息!
  • 本頁收集關于Python 實現任意區域文字識別(OCR)操作的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 公安县| 肇源县| 保亭| 苍南县| 和静县| 蒙城县| 那曲县| 康乐县| 延庆县| 株洲县| 遂昌县| 霍州市| 台前县| 介休市| 射阳县| 通海县| 乡宁县| 塔河县| 梅州市| 塔城市| 乌拉特前旗| 清水县| 栖霞市| 聊城市| 北京市| 东光县| 富阳市| 将乐县| 天气| 安岳县| 旺苍县| 兴文县| 孟村| 临西县| 乐平市| 乌拉特前旗| 郁南县| 扎鲁特旗| 厦门市| 叙永县| 乐安县|