DjVuToy官方版是一款美观易用、功能强大的DjVu处理工具,DjVuToy官方版功能包括图像文件转DjVu,支持PDG、BMP、GIF等格式。转换的同时可以进行OCR,生成双层DjVu。可以插入、删除、移动、旋转多页DjVu中的页面。还可以将多个DjVu文件合并成一个,并加挂书签如果有书签描述文件。DjVuToy官方版包括导出,导入,删除注释。注释(Annotation)可以是超链接,标注等。
文件合并:将散页DjVu文件合并成一个多页DjVu。
文件拆分:将多页DjVu拆分成每页一个文件。
页面调整:插入、删除、移动、旋转多页DjVu中的页面。
生成索引:为文件夹下的散页DjVu文件生成索引文件,打开索引文件即可浏览全部散页文件,就像将散页文件合并成了多页文件一样。但是与多页文件不同,索引文件不能挂书签。
PDG转DjVu:这个不用说了吧?
PDG压缩:对清晰版进行无损压缩,或将清晰版压缩成快速版,或将黑白TIFF转换成PDG。
DjVu书签处理:包括导出书签、加挂书签(支持多级书签)、将中美百万的a.opf、catalog.xml转换成FreePic2Pdf接口文件。
DjVu页宽设置:将多页DjVu的页面宽度或DPI设置为一个统一值。
转为图像:将多页DjVu的每一页转换成一个图像。
DjVu文本处理:包括OCR(生成可检索的隐藏文本)、导出纯文本、导出XML文本、导入XML文本、删除文本。
DjVu转PDF:一次将整本DjVu转换成PDF,并可以选择是否转换书签(目录)。
查看DjVu文件结构:导出DjVu文件结构。
1.下载DjVuToy官方版软件包
2.解压DjVuToy软件,运行“EXE.文件”
3.双击打开,进入DjVuToy软件界面
4. 此软件为绿色版,无需安装即可使用
Q:DjVuToy是什么?
A:这是一个处理DjVu的工具集,具有下列功能:
文件合并:将散页DjVu文件合并成一个多页DjVu。支持指向外部文件的共享数据段。
文件拆分:将多页DjVu拆分成每页一个文件,并可指定是否拆分共享数据段、是否生成索引。
页面调整:插入、删除、移动、旋转多页DjVu中的页面。
生成索引:为文件夹下的散页DjVu文件生成索引文件,打开索引文件即可浏览全部散页文件,就像将散页文件合并成了多页文件一样。
DjVu制作:图像文件转DjVu,支持PDG、BMP、GIF、PNG、TIFF、JPEG、JPEG 2000。
PDG转DjVu:这个不用说了吧?
PDG压缩:对清晰版进行无损压缩,或将清晰版压缩成快速版,或将黑白TIFF转换成PDG。
DjVu页宽设置:将多页DjVu的页面宽度或DPI设置为一个统一值。
转为图像:将多页DjVu的每一页转换成一个图像。
DjVu文本处理:包括OCR(生成可检索的隐藏文本)、导出纯文本、导出XML文本、导入XML文本、删除文本。
DjVu注释相关:包括导出、导入、删除注释。注释(Annotation)可以是超链接、标注等。
DjVu转PDF:一次将整本DjVu转换成PDF,并可选择是否转换书签(目录) 、隐藏文字,没有隐藏文字时还可以在转换的同时进行OCR,并提供对自身所生成的双层PDF进行校对所需的辅助功能。
查看DjVu文件结构:如果打算对DjVu文件内部格式进行研究,这个功能那是相当地有用,不然还是点“显示设置”按钮,把它藏起来算了。
Q:为什么要开发DjVuToy?
A:现在网络上DjVu格式的电子书开始多起来,但是讨论DjVu的专业文章并不多。为了深入了解DjVu文件的各个方面,我就开发了这个软件。因为目的不是很严肃,所以软件的名字也不是很严肃,不过我终于还是很严肃地为它挑选、修改了个一看就是toy的图标。
Q:DjVuToy收费吗?
A:DjVuToy是一个“友情软件”(Friendware),用户在承诺不用于商业目的,也不对文件及其附件进行任何更改的条件下,不需要为使用该软件付任何费用,最多是在BBS上看到我发帖子灌水时(我的ID一般是strnghrs),进去捧个人场,作为友情回报;或者在年节时发个email问声好(所以叫“友情软件”)。我承诺绝不在程序中暗藏任何商业广告、木马,但不承诺为使用DjVuToy的后果承担任何责任。如果您需要将它用于商业目的,或加入您的网站,请与我联系,否则保留追究一切责任的权利。
Q:DjVuToy在将DjVu文件合并、切分、删除、旋转页面,或改变页面顺序、改变页面宽度时,会造成图像质量下降吗?
A:不会,图像数据流保持不变。
Q:FreePic2Pdf接口文件有什么作用?
A:接口文件是从Pdg2Pic和FreePic2Pdf借用过来的,对多级书签进行描述。接口文件的详细格式说明和示例见FreePic2Pdf使用说明。 对书签文件进行编辑推荐使用PdgCntEditor。
Q:有些PDG文件转换不出来,怎么办?
A:详见Pdg2Pic的使用说明。
Q:为什么在合并文件时,如果选择了“合并过程中花时间检查坏页”,DjVu会报告某些文件损坏,但是单独用WinDjView看每页都能正常显示?
A:这种情况通常是下载的时候,散页文件末尾被添加了垃圾数据。解决的办法:
创建一个空文件夹,把问题散页复制进去,然后用“文件合并”功能合并这个文件夹,得到一页结果。
将此一页结果更名为问题散页的文件名,覆盖原问题散页,重新合并即可。
Q:为什么有些散页DjVu文件合并后,从某页开始就无法显示,但是单独用WinDjView看每页都能正常显示?
A:这种情况通常是下载的时候,散页文件末尾被添加了垃圾数据,或文件数据不全。解决的办法:
先定位有问题的散页。办法是把不能显示的页或其前、后页对应的散页删除,重新合并。如果某页删除后合并结果正常,则该页即为问题页。
用WinDjView打开问题页,如果能够打开,多半是文件末尾被添加了垃圾数据,参照前述方法解决;如果不能打开,说明数据不全,只能重新下载。
Q:如何快速检查合并后的DjVu文件是否有问题?
A:严格说来用WinDjView的缩略图看是最保险的,不过如果希望尽量快,也可以用DjVuToy的“文件结构”功能,导出文件结构为文本文件,如果此过程中没有报错,基本没有问题,否则可能有问题。
Q:OCR功能有什么用?在什么情况下可以使用?
A:OCR功能在DjVu文件中生成隐藏文本,这些文本平时不可见,但可用WinDjVu的“Edit->Find”功能检索,也可以用“File->Export Text”功能导出。隐藏文本不仅有文本信息,而且有位置信息,因此用鼠标按住左键在DjVu页面上拖动,可以选中隐藏文字,并复制到剪贴板。
DjVuToy的OCR功能对DjVu中的原始图像不会造成任何影响,因此可以对其它软件生成的DjVu文件进行OCR,以实现强强联合:目前DjVu制作软件以国外的为佳,但是国外DjVu制作软件在OCR中文时总觉得不如本土软件。DjVuToy的OCR引擎是微软从清华购买的,中文OCR效果不错。
当然再好的OCR软件都不可能完全准确,因此DjVuToy提供了独创性的“导出XML文本”、“导入XML文本”功能,可以将隐藏文本及其位置信息以XML格式导出,进行人工校对,然后再导入DjVu文件。 另外这两个功能也可以用于文本的繁简转换:将繁体导出,用TextForever或其它转码软件转成简体,然后再导入。
当然如果您有更好的OCR引擎,也可以自己写一个软件,OCR后输出符合DjVuToy格式要求的XML文件,然后用DjVuToy导入。
DjVuToy的OCR功能需要微软Office 2003/2007的Microsoft Office Document Imaging(MODI)的支持,在简体中文环境下进行安装、配置,以OCR繁体中文、日文、韩文的方法,可以 参阅我写的《用MODI OCR 21种语言》一文。
OCR质量与图像质量密切相关,图像分辨率越高、越是黑白分明,OCR结果就越好。如果图像分辨率低于300 DPI,建议就别OCR了,以免结果太过搞笑。
Q:DjVu转PDF依据什么样的规则?转换是否有损?
A:遵循下面的规则:
JB2数据流直接转换成JBig2数据流,并且保证字典、页面描述转换前后一一对应,因此不仅是完全无损的,而且转换前后数据流长度差异不大。
IW44数据流先解码成图像,再重新压缩成接近原IW44数据流长度的JPEG 2000数据流。因此转换过程是有损的,不过肉眼不大看得出来,转换前后数据流长度差异也不大。
对于单层DjVu,按照规则1、2转换成单图像,嵌入PDF。
对于3层DjVu,每层图像按照规则1、2转换成一个图像,其中一个作为soft mask。
对于2层DjVu(即彩色文本,color text),事情有点复杂,因为PDF中没有对应的结构,所以只能按照3层转换,而且为了保证文字清晰度,中间层还必须与前景层一样大小,造成最终文件长度膨胀。
同类推荐
2022-09-14
立即下载2022-09-14
立即下载2022-09-14
立即下载2022-09-14
立即下载2022-09-14
立即下载2022-09-14
立即下载相关文章
Windows 11 22H2文件管理器基本确认会引入标签功能
2022-07-07Win11文件管理器引入UI 简化右键菜单
2021-06-29达人重新设计Win10文件管理器 引网友疯狂点赞
2021-04-16设计比微软官方用心!Win10 最炫酷的文件管理器
2020-09-15Win10文件管理员权限怎么设置
2020-09-12详解微软 Win10 上的 Windows 3.0 文件管理器
2020-09-04外媒希望Win10文件管理器:更现代化 支持标签页
2020-07-27最新 Win10 19603新功能:WSL中支持文件管理器
2020-04-09YY语音加入别人频道的方法
2020-11-20Bandicam录制画面黑屏怎么解决?
2022-02-14