Tesseract文本识别引擎 Tesseract是一个开源文本识别(OCR)引擎,各个平台能都使用。48K的start给了我满满的安心感,还不需要装环境,本文是对其的尝试。 2023-01-04 技术类 #深度学习 #OCR
paddle的OCR 最近在研究机器人,就涉及到OCR,我现在基本放弃自己学习了,设备性能不行,直接用别人的模型挺香的。最开始选择阿里魔塔的模型,但是特么检测和识别居然一个是tensorflow一个是pytorch,就无语,于是转头用paddle的试试。 2022-12-30 技术类 #深度学习 #OCR
通过web页面进行屏幕录制和下载 最新发现了个在线录屏的网站,对于不想下独立录制软件,但偶尔有录制屏幕需求,怕麻烦的我来说,相当好用!于是也想看看是怎么实现的,本文是对其的记录,因为它也不是开源,这里实现了个劣化版本。 2022-12-06 技术类 #工具 #web
yolov5目标检测使用尝试 最新有个检测区域内是否有人的需求,一开始试着用modelscope上的模型,但是速度太慢,无法满足实时检测。在朋友推荐下发现了yolov5,本文是对其使用的笔记。 2022-11-25 技术类 #深度学习