钉钉OCR文字识别功能

January 13, 2022

参考：

钉钉app进行文字识别

打开钉钉app 》顶部导航“协作” 》文档》右上角“…”菜单》拍图识字
可以直接拍照，也能上传手机相册的图片

注意：

相册中选择，一次最高只能选择 9 张图片，单张图片的长度不能太长（使用，长截图要注意）

pdf 进行文字识别

使用 acrobat 将 pdf 到处为图片（会每页到处为一张图片）
可以使用 convert 命令对图片进行合并
1
convert image1.png image2.png image3.png -append result/result-sprite.png
注意：单张图片的长度不能太长，否则后面钉钉文字识别不了

concat-img-to-ocr 脚本，将pdf转出来的图片拼接，按照每组几个（第二个参数）来拼接出一组新的图片

上传图片到手机

使用示例，脚本见 adb-push-img

 # 单图片上传
 adb-push-img 某pdf导出成的图片_页面_01.jpg Pictures/Screenshots

 # 批量上传
 ls -1 某pdf导出成的图片_* | xargs -I {} adb-push-img {} Pictures/Screenshots

钉钉app进行文字识别，从相册选择图片

脚本 `adb-push-img`

#!/bin/bash

adb push "$1" "/sdcard/$2/$1"
adb shell am broadcast -a android.intent.action.MEDIA_SCANNER_SCAN_FILE -d "file:////storage/emulated/0/$2/$1"

脚本 concat-img-to-ocr，将pdf转出来的图片拼接，按照每组几个（第二个参数）来拼接出一组新的图片

示例：按图片名字顺序，没3张合成一个图片： concat-img-to-ocr xxxpdf文件名_页面 3

#!/bin/bash

# help
# $1 pdf file name. A image exported from acrobat, is prefixed by the pdf file name
# $2 conut of images to concat

COUNTER=1
CONCAT_NUM=$2
IN_FILES=" "
OUT_COUNT=1
for f in $(ls -1 "$1"*.jpg | sort)
do
  IN_FILES=$IN_FILES"$f "
  
  MOD=$(( $COUNTER % $CONCAT_NUM ))
  echo "MOD: $MOD"
  echo "IN_FILES: $IN_FILES"
  
  if [ $MOD = 0 ]; then
    echo "MOD == 0"
    convert $IN_FILES -append $1"-concat-"$OUT_COUNT".jpg"
    let OUT_COUNT=$OUT_COUNT+1
    IN_FILES=" "
  fi
  
  let COUNTER=$COUNTER+1
done

if [ $MOD != 0 ]; then
  convert $IN_FILES -append $1"-concat-"$OUT_COUNT".jpg"
fi
echo "MOD: $MOD"
echo "COUNTER: $COUNTER"

钉钉OCR文字识别功能

January 13, 2022

钉钉app进行文字识别

pdf 进行文字识别

脚本 adb-push-img

脚本 concat-img-to-ocr，将pdf转出来的图片拼接，按照每组几个（第二个参数）来拼接出一组新的图片

脚本 `adb-push-img`