OCR

OCR 工具汇总

nougat

尝试让claude将pdf转为markdown,但是公式识别都错的,只能手动了。

关于ocr公式,可以试试nougat

1
2
nougat /path/file.pdf -o /path/
nougat "D:\test1.pdf" -o "D:\test"

运行后,又

指出要comet.ml的api,只能火速注册一个,api 见官网 -> comet.ml (非必需)

1
2
export COMET_API_KEY='YOUR_LONG_API_TOKEN'
export PYTORCH_MPS_DISABLE=1

寄,b Mac跑torch问题多多,内存也寄。 op上轻松秒杀了,但是不支持中文。找了点原版的英语教材,看公式都秒杀了。输出的mmd文件需要安装vscode插件 -> mathpix-markdown-it

PDF Expert OCR

Update: 2023-09-26

尝试一下 PDF Expert 的 OCR 功能,发现速度比较慢,同时文件体积也会增加不少,识别效果也一般,不建议使用。