钉钉OCR文字识别功能
钉钉app进行文字识别
- 打开钉钉app 》顶部导航“协作” 》文档 》 右上角“…”菜单 》拍图识字
- 可以直接拍照,也能上传手机相册的图片
注意:
- 相册中选择,一次最高只能选择 9 张图片,单张图片的长度不能太长(使用,长截图要注意)
pdf 进行文字识别
-
使用 acrobat 将 pdf 到处为 图片(会每页到处为一张图片)
- 可以使用 convert 命令对图片进行合并
1
convert image1.png image2.png image3.png -append result/result-sprite.png
注意:
单张图片的长度不能太长
,否则后面钉钉文字识别不了concat-img-to-ocr 脚本,将pdf转出来的图片拼接,按照每组几个(第二个参数)来拼接出一组新的图片
-
上传图片到手机
- 使用示例,脚本见 adb-push-img
1 2 3 4 5
# 单图片上传 adb-push-img 某pdf导出成的图片_页面_01.jpg Pictures/Screenshots # 批量上传 ls -1 某pdf导出成的图片_* | xargs -I {} adb-push-img {} Pictures/Screenshots
- 钉钉app进行文字识别,从相册选择图片
脚本 adb-push-img
1 2 3 4 | #!/bin/bash adb push "$1" "/sdcard/$2/$1" adb shell am broadcast -a android.intent.action.MEDIA_SCANNER_SCAN_FILE -d "file:////storage/emulated/0/$2/$1" |
脚本 concat-img-to-ocr,将pdf转出来的图片拼接,按照每组几个(第二个参数)来拼接出一组新的图片
示例: 按图片名字顺序,没3张合成一个图片: concat-img-to-ocr xxxpdf文件名_页面 3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 | #!/bin/bash # help # $1 pdf file name. A image exported from acrobat, is prefixed by the pdf file name # $2 conut of images to concat COUNTER=1 CONCAT_NUM=$2 IN_FILES=" " OUT_COUNT=1 for f in $(ls -1 "$1"*.jpg | sort) do IN_FILES=$IN_FILES"$f " MOD=$(( $COUNTER % $CONCAT_NUM )) echo "MOD: $MOD" echo "IN_FILES: $IN_FILES" if [ $MOD = 0 ]; then echo "MOD == 0" convert $IN_FILES -append $1"-concat-"$OUT_COUNT".jpg" let OUT_COUNT=$OUT_COUNT+1 IN_FILES=" " fi let COUNTER=$COUNTER+1 done if [ $MOD != 0 ]; then convert $IN_FILES -append $1"-concat-"$OUT_COUNT".jpg" fi echo "MOD: $MOD" echo "COUNTER: $COUNTER" |