钉钉OCR文字识别功能

  • 参考:

钉钉app进行文字识别

  1. 打开钉钉app 》顶部导航“协作” 》文档 》 右上角“…”菜单 》拍图识字
  2. 可以直接拍照,也能上传手机相册的图片

注意:

  1. 相册中选择,一次最高只能选择 9 张图片,单张图片的长度不能太长(使用,长截图要注意)

pdf 进行文字识别

  1. 使用 acrobat 将 pdf 到处为 图片(会每页到处为一张图片)

  2. 可以使用 convert 命令对图片进行合并
    1
     convert image1.png image2.png image3.png -append result/result-sprite.png
    

    注意:单张图片的长度不能太长,否则后面钉钉文字识别不了

    concat-img-to-ocr 脚本,将pdf转出来的图片拼接,按照每组几个(第二个参数)来拼接出一组新的图片

  3. 上传图片到手机

    1
    2
    3
    4
    5
     # 单图片上传
     adb-push-img 某pdf导出成的图片_页面_01.jpg Pictures/Screenshots
    
     # 批量上传
     ls -1 某pdf导出成的图片_* | xargs -I {} adb-push-img {} Pictures/Screenshots
    
  4. 钉钉app进行文字识别,从相册选择图片

脚本 adb-push-img

1
2
3
4
#!/bin/bash

adb push "$1" "/sdcard/$2/$1"
adb shell am broadcast -a android.intent.action.MEDIA_SCANNER_SCAN_FILE -d "file:////storage/emulated/0/$2/$1"

脚本 concat-img-to-ocr,将pdf转出来的图片拼接,按照每组几个(第二个参数)来拼接出一组新的图片

示例: 按图片名字顺序,没3张合成一个图片: concat-img-to-ocr xxxpdf文件名_页面 3

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#!/bin/bash

# help
# $1 pdf file name. A image exported from acrobat, is prefixed by the pdf file name
# $2 conut of images to concat

COUNTER=1
CONCAT_NUM=$2
IN_FILES=" "
OUT_COUNT=1
for f in $(ls -1 "$1"*.jpg | sort)
do
  IN_FILES=$IN_FILES"$f "
  
  MOD=$(( $COUNTER % $CONCAT_NUM ))
  echo "MOD: $MOD"
  echo "IN_FILES: $IN_FILES"
  
  if [ $MOD = 0 ]; then
    echo "MOD == 0"
    convert $IN_FILES -append $1"-concat-"$OUT_COUNT".jpg"
    let OUT_COUNT=$OUT_COUNT+1
    IN_FILES=" "
  fi
  
  let COUNTER=$COUNTER+1
done

if [ $MOD != 0 ]; then
  convert $IN_FILES -append $1"-concat-"$OUT_COUNT".jpg"
fi
echo "MOD: $MOD"
echo "COUNTER: $COUNTER"