电子市场 - zhanpanpan的BLOG http://zhanpanpan.52rd.net - 复制 - 收藏
zhanpanpan 发表于 2008-4-15 16:38:00

应该说,PDF文档的规范性使得浏览者在阅读上方便了许多,但倘若要从里面提取些资料,实在是麻烦的可以。回忆起当初做毕业设计时规定的英文翻译,痛苦的要命,竟然傻到用Print Screen截取画面到画图板,再回粘到word中,够白了:(最近连做几份商务标书,从Honeywell本部获取的业绩资料全部是英文版的PDF,为了不再被折磨,花费了一个晚上的时间研究PDF和Word文件的转换,找到下面2种方法,出于无产阶级所谓的同甘共苦之心,共享下:)


1、实现工具:Office 2003中自带的Microsoft Office Document Imaging


应用情景:目前国外很多软件的支持信息都使用PDF方式进行发布,如果没有Adobe Reader,无法查看其内容,如果没有相关的编辑软件又无法编辑PDF文件。转换为DOC格式则可以实现编辑功能。尽管有些软件也可以完成PDF转换为DOC的工作,但很多都不支持中文,我们利用Office 2003中的Microsoft Office Document Imaging组件来实现这一要求最为方便。

  使用方法:

  第一步:首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

  编辑提示:如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。

  第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在bomb出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。

  编辑提示:目前,包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。


2、实现工具:Solid Converter PDF


应用情景:利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转Word文档在一定程度上的确可以实现PDF文档到Word文档的转换,但是对于很多“不规则”的PDF文档来说,利用上面的方法转换出来的Word文档中常常是乱码一片。为了恢复PDF的原貌,推荐的这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成需要的样板形式。

维库电子人才网现招聘 电子工程师  技术员。想加入我们的团队请了解详情 http://www.dzrc.com.cn

阅读全文(1230) | 评论(3)
评 论
3楼 jayhe 发表于 2008-6-23 14:55:00
谢谢@! 就是转换出来的东东,有小部分丢失.
2楼 eyas008 发表于 2008-4-19 17:51:00
谢谢喽,我试过了,和你说的完全一样,辛苦了,又学到了东西!谢谢!
1楼 暱名(游客) 发表于 2008-4-18 16:52:00
真是個好消息, 但是我不能使用Adobe Reader打开待转换的PDF文件, "Microsoft Office Document Imaging"這個我有安裝......
9 1 :
昵 称: 匿名
验证码: 2888
博 主
进入zhanpanpan的首页
博客名称:电子市场
日志总数:58
评论数量:55
访问次数:46018
建立时间:2008年1月15日
导 航
日 历
«Mar.2010»
123456
78910111213
14151617181920
21222324252627
28293031
公 告
暂无公告...
日 志
评 论
链 接