第一种方法:
如果是office 2003,可以利用Microsoft Office Document Imaging组件的ocr功能.
第一步:首先使用CAJ浏览器打开文档,接下来选择打印,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该NH文件输出为MDI格式的虚拟打印文件。
提示:如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。
第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,确认即可。
第二种方法:
好象CAJ5.0以上版本可以转换为WORD文档,只过不可以转换图象,公式,图表,但是您可以用“复制图位”按钮,以图象方式复制到WORD文档.
CAJ支持另存为TXT,操作在“文件”选项里,但TXT为文本文件,不能保存图片,公式,图表等,可由TXT转为DOC后,通过“复制图位”按钮,以图象方式复制到WORD文档中去。
也可以用Acorbat7.0打印成pdf后直接另存为DOC。