秦灭楚之战项羽在哪里:为什么我用尚书七号识别一张图中的文字结果全是乱码?

来源:百度文库 编辑:查人人中国名人网 时间:2024/04/28 18:03:58
这张图整张都是文字。

请不要直接复制答案!!!直接复制的回答我不设最佳!!!!
为什么我用尚书七号识别一张图中的文字结果全是乱码?

这张图整张都是文字。

我在这个网站可以识别http://www.netocr.com/login.aspx

但我自己识别就全是乱码。

怎么办!!!!

怎么办!!!!!!!!!!!

文字如果有图像背景的话 识别的效果绝对不好 如果一定需要用尚书这样的软件来识别的话 要花很长的时间来处理这个图片 在实际应用中 一般是得不偿失

虎贲〓中郎将讲的已经比较详细了 总之一句话 用一切可能的办法去除背景和不必要的东西 另外尚书对斜体字的识别非常不理想

我个人觉得最现实的办法还是打字打出来

5.1前恰用尚书好处理了很多文字,实际工作中我也经常需要用到尚书
纯属经验之谈 目前应该还没有什么好的办法!

另外需要注意的是 扫描的时候选择目标是OCR 这样出来的图像自动是灰度的 尽量扫的分辨率大一些,可以是800甚至更高,用PHOTOSHOP处理之后 另存JPEG 分辨率可以降到300!

如果你有兴趣可以把图片传给我 我这里PS和尚书都有 我帮你处理

QQ:56402097

一、你最好跟尚书七号的生产商也就是清华紫光联系,升级你的OCR软件。
二、你要做好处理好你的图片,一般来说用OCR软件做文字识别的图最好在黑白或灰度图形下进行,因为这样可以减少不必要的识别干拢。
三、可能你还要学习一下图像处理。对于一些不规则图像做简单的处理。

看了半天大家都说得很笼统,我教你用photoshop的具体办法:
1、去除背景图:如果背景图颜色单一,可以用魔棒工具直接选取,适当增加容差会加大选区。
如果背景图比较复杂,就要用钢笔工具慢慢勾选或用图章工具将背景图替换,但这对于初学者不易掌握。建议初学者使用磁性套锁工具慢慢勾选,或直接用橡皮将背景斜文字慢慢擦掉。
2、现在背景比较单一了,依次点图像--调整--色阶(或按快捷键CTRL+L)打开色阶选项,会看到中间犹如波形的图像,图像下面有3个小三角。把最右边的小三角向左拉一点,再把中间的小三角向右拉一点,你会看到文字变的更黑了和背景变的更白了,意思就是让他们对比更明显。
3、保存后再用尚书5笔或方正OCR或汉王汉字识别等软件识别。

全是乱码的话,可能是图片的质量不佳,就是前景文字与背景的颜色对比不大,或背景上污点较多。

还有,就是因为文字没有较正方向,有点儿倾斜。

当然,还有此识别软件,有些字体是不能识别的。只能识别大众化的字体,如宋体、楷体等,但对幼园字体识别不佳。

你检查一下你的图片是不是背景太花、文字和表格黑白不明显、分辨率不足等等,这些都有可能会影响到识别的正确率。应该是分辨率不足才造成你识别后是标点符号,建议你增加图片的分辨率,至少要达到200dpi,一般可采用300dpi。

用亮度/对比度,提高文章的色差,去掉背景。
得看到图才好说具体办法!