清华紫光OCR(TH-OCR)
清华紫光OCR(TH-OCR)安装教程
清华紫光OCR(TH-OCR)是一款专业的图像汉字识别软件,它可以帮助你直接把图片信息“挖”出来,软件支持从TIF、BMP和PCX图片格式中读取文字内容,支持简/繁体中文、英文和手写中英文,虽然不敢保证全部能读取(尤其文字靠近边框是,比较容易出错),但至少大部分能读取正确。
清华紫光OCR介绍
清华紫光OCR(TH-OCR)是一款拥有完全知识自主产权的图像汉字识别软件,本软件由清华大学1985年开始研发,对中日韩文与英文混排文档的识别水平超过国外同行效果。它的使用很简单,用鼠标框住你要“挖”出来的文字,点“识别(就是那个眼镜一样的图标)”,文字就这样简单的出来了,你可以直接复制或者是保存为文本文档,还是很方便的。
清华紫光OCR(TH-OCR)使用方法
- 文件->打开,选择要识别的文件,可以是tif、bmp、jpg格式的
- 命令->识别,会自动识别的
- 识别完成后,软件左边的树状栏里会有图像文件名,用鼠标点开哪个加号,就是识别后的文本文件
- 单击它,软件右边上方是识别后的文本,下方是被识别的图像文件
- 这时用键盘移动光标,就能查看图像和对应文本,并能直接改动文本
- 二值图像就是只有黑白两色的图像,用windows自带的画图软件就能做出来
- 先用画图打开图像,图像->属性,将颜色改成黑白,再存盘就得到二值图像了