python3+BaiduOcr Api实现简单的图片/照片文字识别提取。

运行环境:ubuntu20.04+python3.8。
所需api:百度ocr,请自行注册。

因为很多客户需要开发票,很多时候每次发过来的开票信息都是一张图片。对于我这样粗心的人来说,很容易就打错客户信息。于是写个小脚本偷个懒。

代码:

from aip import AipOcr

# 定义常量
APP_ID = '自行获取'
API_KEY = '自行获取'
SECRET_KEY = '自行获取'

# 初始化AipFace对象
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片
filePath = "123.jpg"

def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()

# 定义参数变量
options = {
'detect_direction': 'true',
'language_type': 'CHN_ENG',
}

# 调用通用文字识别接口
result = aipOcr.basicGeneral(get_file_content(filePath), options)
print(result)
words_result=result['words_result']
for i in range(len(words_result)):
print(words_result[i]['words'])

测试图片:

测试结果:

其中123.jpg就是你截图的文件,放入py文件目录,运行python3 your_filename_.py即可。

给TA买糖
共{{data.count}}人
人已赞赏
站长笔记

2021|ubuntu-server使用Rclone挂载OneDrive

2021-3-29 23:48:12

站长笔记

增值税开票软件不同型号打印机参数设置大全(税控盘版)

2021-4-11 10:29:21

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索