ocr
OCR
OCR 工具汇总
nougat
尝试让claude将pdf转为markdown,但是公式识别都错的,只能手动了。
关于ocr公式,可以试试nougat
1 | nougat /path/file.pdf -o /path/ |
运行后,又
指出要comet.ml的api,只能火速注册一个,api 见官网 -> comet.ml (非必需)
1 | export COMET_API_KEY='YOUR_LONG_API_TOKEN' |
寄,b Mac跑torch问题多多,内存也寄。 op上轻松秒杀了,但是不支持中文。找了点原版的英语教材,看公式都秒杀了。输出的mmd
文件需要安装vscode插件 -> mathpix-markdown-it
PDF Expert OCR
Update: 2023-09-26
尝试一下 PDF Expert 的 OCR 功能,发现速度比较慢,同时文件体积也会增加不少,识别效果也一般,不建议使用。
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.