chatgpt
excel图片地址直接显示图-凯发ag旗舰厅登录网址下载
失踪日久,皆因进来学业繁重,其实就是没好好学习。偶遇一有趣需求,方才始更一篇。
需求如下:图片内表格,需直接将图片转换为excel表格。
初步构想,迅捷在线转换,奈何没找到直接转换,图片转pdf再转为excel又过于繁琐,结合当下opencv及百度ai的学习更番如下:
首先想到使用opencv库(laplace算子)进行图像锐化,此处说明由于多数图像为白纸黑字所以锐化是十分有必要的,识别文字边框,进而进行图片中文字识别。但因受限于网络图片清晰度及受限于本身pc的算力等原因造成识别结果差异化严重所以最终放弃。(但是后期会补上代码)此次识别过程结果如下,不理想。
进而开始另求它法,因为最近在学习计算机视觉相关内容,所以各大ai平台的公开接口是绕不开的。本次使用的百度ai大脑开放的ocr接口,识别精度肯定比个人pc的强,毕竟算力的差距在那。插一句,我个人是一直认为百度的技术积累是bat三家里面最好的,也是最值得期待的。
本次使用的百度开放给公共用户的通用文字识别接口,为求精度本次使用的是高精度版本:https://ai.baidu.com/tech/ocr/general
高精度版本在通用文字识别(标准版)的基础上,提供更高精度的识别服务,支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语),并将字库从1w 扩展到2w ,能识别所有常用字和大部分生僻字。
开发语言选取python,也是最近一直在学,没办法,学人工智障绕不开的。
在准备开发之前首先确保你已经完成了百度ai平台的注册,申请到了orc识别的接口,一般申请都会过的,万一你没过,反思一下最近是不是在哪捡钱了。
接口请求方式采用post
post和get这两种请求方式各位在面向对象程序设计应该都学过,当然这里不确保你有对象哈!
请求url:https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic重点圈起来,这个请求的地址是统一的。
然后你需要获取到个人接口的access_token,这里的access_token类似于你微信的id,确保你调用接口返回参数的唯一性。
百度ai的开发文档给出了多种获取access_token的方式,我最建议的还是内嵌到你的程序中去。
返回参数提供了json/excel两种可选(哈哈哈哈哈哈哈哈,难道百度知道我要转excel),选择request_type类型为:excel,然后循环写入excel文档。因未能识别框线所以还是需要手动注线,后期笔者努力尽快解决。识别结果:
注:注意开发过程中的个人sessionid和key的正确性,转换结果文档默认保存到了当前工程目录下!
近期会持续更新一些考研相关的注意事项,以及opencv的相关内容和关于ocr识别的案例。
本次工程git链接:https://github.com/sevnxiaolu/ptt.git
感谢star!
最后希望各位最后10天好好复习,上岸成功!
总结
以上是凯发ag旗舰厅登录网址下载为你收集整理的excel图片地址直接显示图_图片转表格基于百度ai的全部内容,希望文章能够帮你解决所遇到的问题。
如果觉得凯发ag旗舰厅登录网址下载网站内容还不错,欢迎将凯发ag旗舰厅登录网址下载推荐给好友。
- 上一篇:
- 下一篇: