标题: [专题] 给予那些苦于寻找OCR版本的同学------ABBYY FineReader
  本主题由 naluoyssimi 于 2007-12-10 19:37 关闭 
magusylian
奥德赛TIF工作室
Rank: 6Rank: 6


上传先锋奖   TIF工作室成员   ODY红包  
UID 6517
精华 10
积分 5406
帖子 269
威望 359
奥币 2838
贡献 5
阅读权限 50
注册 2006-10-5
状态 离线
发表于 2007-5-10 23:57  资料  短消息  加为好友  添加 magusylian 为MSN好友 通过MSN和 magusylian 交谈
给予那些苦于寻找OCR版本的同学------ABBYY FineReader

文字识别转换的好帮手——ABBYY FineReader 8.0


看PDF格式的电子书时,尤其是遇到那些直接由图片作成的PDF格式的电子书,有时
会想把大段的文字或图象摘下来,却苦于枯燥的手工输入。翻译和制作电子书时更
是如此。下面介绍的软件可以将效率大大提高,自己动手制作OCR版本。

ABBYY FineReader是一款俄罗斯的文字识别软件。
该软件最主要的特点是:对英文的识别能力非常强,正确率非常高,使用简单.

功能:
支持多国文字(暂不支持中文,日文等亚洲文字),还支持彩色文件识别自动保留原稿插图排版格式以及后台批处理识别功能,能够直接在 MS Word、MS Excel、WordPerfect 及 Word Pro 中扫描和读取文件、信件或各类表格,并且能存成 RTF、TXT、DOC、CSV、XLS 或 HTML 等格式。它能保持表格与图片中原始的多栏页面设计。FineReader Professional 在识别方面支持 ADF (自动进纸)扫描仪,批处理,拼音检查,强大的表格工具,多语言文件,背景运算和学习新的字体。

ABBYY FineReader 8.0(目前最高版本)在一个应用程序中提供三个不同的PDF转换功能:

打开 PDF 文件并且转换它成可编辑的格式(例如 Microsoft Word 或 Excel)。
打开 PDF 文件,执行少量正文编辑,然后保存回 PDF。
从纸上文档创建可搜索的 PDF 文件。

==========================================================

以下是我用Magic of Faerun的PDF文件进行的简单测试:

按照菜单栏的1.2.3.4步就能完成简单的转换。

第一步Open Image
打开PDF文件(同样支持图片文件),系统会进行批量打开操作,
接着出现4个展开的窗口,
IMAGE窗口是原图,竖列的第一个图标是自动对图片进行文字块的识别(一些花样的标题字体也能识别出来,但大多数情况下,在转换成WORD文档时是乱码)。
下边的几个图标是自定义转换区域、抽取表格(也可以把不是表格的作成表格,感觉这个比EXCEL还方便)、抽取图片等。



第二步Read
TEXT窗口就是转换后的格式,可保存成WORD等多种可编辑格式。
在选定要转换的文字区域后,按下菜单栏的2 Read就可以在TEXT栏里看到转换后的文字了,而且转换后的排版格式和原图相同



第三步Check spelling
在转换后的TEXT窗口中,系统认为有拼写错误的单词都会用兰色标出,按下Check spelling按钮,弹出来的对话框就会帮助你改错误。

第四步Save
将转换好的TEXT窗口中的文字转换成WORD等格式的文件。

======================================

根据原图片字体的不同,转换后的文字的错误率也会有所差别。
一般字体的辨识正确率较高,当然,这要比人工录入效率高很多。

原版(多国语言版)的在emule上有下,不过文件很大,170M。
介绍和使用方法:http://lib.verycd.com/2006/01/26/0000086868.html

我用的是36M的版本,应该是单英文版的,基本的功能都支持。有需要的再上传FTP。

安装完后需用注册机注册,否则只能试用15天。
安装说明:
1. 用keygen生成序列号;(压缩包里自带)
2.注册和激活。
安装完成后马上运行 ABBYY FineReader Professional v8.0.706 ,会要求激活。未注册版本只能试用15天全功能。
点取消后在HELP菜单栏里选择“Activate The program now”,在需要输入serial number的地方输入由keygen产生的序列号,
接着选择“by fax or phone”,然后将“Installation ID”中的代码复制到keygen(注册机)中的相映位置,算出激活码,
再复制到注册页面的激活码框中就OK了。

希望会对翻译或制作电子书的同学有所帮助。

------------------------------------------------------
magusylian ,能给传个这软件到FTP #3么?谢谢


本帖最近评分记录
Lala   2007-5-11 10:44  威望  +10   谢谢分享,很有用的信息。
Lala   2007-5-11 10:44  奥币  +20   谢谢分享,很有用的信息。
顶部
青萝
版主
Rank: 7Rank: 7Rank: 7


费伦学者   版主专用   TIF工作室成员   小红花  
UID 8581
精华 31
积分 13169
帖子 1484
威望 1530
奥币 1952
贡献 0
阅读权限 100
注册 2006-11-13
来自 印记城
状态 在线
发表于 2007-5-11 00:51  资料  短消息  加为好友 
多谢楼主的介绍,这就去下载试试看。另外我现在用的是一款功能与此类似的名叫“文通慧视”的国产软件,效果也不错。

顶部
lofeiy
版主
Rank: 7Rank: 7Rank: 7
小斐


宣传大使奖   ODY MM专用   版主专用   TIF工作室成员  
UID 12952
精华 2
积分 2709
帖子 234
威望 148
奥币 391
贡献 266
阅读权限 100
注册 2007-3-7
状态 离线
发表于 2007-5-11 01:31  资料  短消息  加为好友  添加 lofeiy 为MSN好友 通过MSN和 lofeiy 交谈
请问这软体是用英文显示吗?(因为我的电脑显示简体中文会有问题)
若是的话,我很想要耶,不晓得能不能上传到ftp,若是不成的话我再想办法好了。

顶部
magusylian
奥德赛TIF工作室
Rank: 6Rank: 6


上传先锋奖   TIF工作室成员   ODY红包  
UID 6517
精华 10
积分 5406
帖子 269
威望 359
奥币 2838
贡献 5
阅读权限 50
注册 2006-10-5
状态 离线
发表于 2007-5-11 18:07  资料  短消息  加为好友  添加 magusylian 为MSN好友 通过MSN和 magusylian 交谈
to lofeiy:
是英文显示

识别中文的话还是用国产软件好....
不过说实话中文还真是不好识别,不仅占的BYTE多,规律更不好找.

上传完毕.

顶部
lofeiy
版主
Rank: 7Rank: 7Rank: 7
小斐


宣传大使奖   ODY MM专用   版主专用   TIF工作室成员  
UID 12952
精华 2
积分 2709
帖子 234
威望 148
奥币 391
贡献 266
阅读权限 100
注册 2007-3-7
状态 离线
发表于 2007-5-12 15:53  资料  短消息  加为好友  添加 lofeiy 为MSN好友 通过MSN和 lofeiy 交谈


QUOTE:
原帖由 magusylian 于 2007-5-11 18:07 发表
to lofeiy:
是英文显示
识别中文的话还是用国产软件好....
不过说实话中文还真是不好识别,不仅占的BYTE多,规律更不好找.
上传完毕.

謝謝magusylian,已經下了,有空會趕快裝來試試

顶部
一击脱离
中级会员
Rank: 3Rank: 3



UID 15461
精华 0
积分 369
帖子 128
威望 8
奥币 125
贡献 0
阅读权限 30
注册 2007-4-8
来自 上海
状态 离线
发表于 2007-5-13 14:02  资料  短消息  加为好友  添加 一击脱离 为MSN好友 通过MSN和 一击脱离 交谈
谢谢lz的介绍,总是在找好的OCR软件,如果能对中文的支持好一些的话就完美了!

顶部
mqw301502
奥德赛TIF工作室
Rank: 6Rank: 6
坑神选民



TIF工作室成员   小红花  
UID 7979
精华 4
积分 4333
帖子 267
威望 455
奥币 580
贡献 0
阅读权限 50
注册 2006-11-6
来自 河北省廊坊市
状态 离线
发表于 2007-12-8 09:48  资料  短消息  加为好友 
我用magusylian前辈上传的算号器似乎不能注册成功,不过我从电驴上找到一个能用的,大家需不需要我上传上来?

顶部
Ericooo
初级会员
Rank: 2



UID 20444
精华 0
积分 91
帖子 30
威望 6
奥币 19
贡献 0
阅读权限 20
注册 2007-12-6
状态 离线
发表于 2007-12-9 11:46  资料  短消息  加为好友 
我倒有破解pdf的软件,只是不太方便放出来,呵呵

顶部
dickgb
奥德赛正式会员
Rank: 4



UID 6231
精华 6
积分 1462
帖子 107
威望 136
奥币 150
贡献 3
阅读权限 50
注册 2006-9-26
状态 离线
发表于 2007-12-10 19:34  资料  短消息  加为好友 
不支持中文嘛?可惜了不然我就可以把一些图片改成WORD了..........

顶部
 



当前时区 GMT+8, 现在时间是 2008-5-16 13:49
沪ICP备06018944号

    本论坛支付平台由支付宝提供
携手打造安全诚信的交易社区 Powered by Discuz! 5.5.0  © 2001-2007 Comsenz Inc.
Processed in 0.171104 second(s), 9 queries

清除 Cookies - 联系我们 - 奥德赛公会 - Archiver - WAP