PDF转Word SDK效果对比
  KHeYkZhlBPzi 2023年11月02日 28 0

Hello 大家好,我是小瘪三。我们打工人平时办公免不了要对一些文档格式行转换。我们将探讨几款主流的 PDF 转 Word SDK,分析它们在我们打工人的实际工作中所呈现的优势与劣势。


  1. Solid:老牌的 PDF to Office 转档库,有几十年的积累。
  2. Aspose: 支持非常多的文件格式互转,也包含PDF 转 word 。
  3. Foxit:自主研发 PDF ,PDF to Office 也是最近刚推出的。
  4. ComPDFKit: 最近一家新锐公司,更新频率很高。

话不多说,直接对比一下 PDF 转 word 的效果。


对比表:

我分别挑选了一些不同特征的文档进行测试,其中包括页数多,包含表格,图文混排。涉及到论文,cad制图,金融等领域,先看一下这些文档的转档耗时。

PDF转Word SDK效果对比_文本框

PDF转Word SDK效果对比_图文混排_02

12个文档中,foxit 有三个文档没有转换成功,其他三个 SDK 全部文档都转换成功了。Aspose  SDK 因为试用原因只能转换前4页,但是有些情况下对比其他三个转了全部页面的速度还慢。综合下来ComPDFKit的转换速度最快。接下来我们看一下具体效果。


效果文档 - 651页文档.pdf原文档

PDF转Word SDK效果对比_图文混排_03

各SDK厂商转档对比


  • ComPDFKit:基本没啥问题,但是字体和原文档有区别

    PDF转Word SDK效果对比_Word_04

    PDF转Word SDK效果对比_文本框_05

  • 福昕:可以看到会有一些小的识别错误,主要在跨行的时候,存在部分粗体识别错误的情况

    PDF转Word SDK效果对比_Word_06

    PDF转Word SDK效果对比_文本框_07

  • Solid: 基本也没啥问题,没什么错误,不过也存在字体区别。

    PDF转Word SDK效果对比_Word_08

    PDF转Word SDK效果对比_Word_09

效果文档 - 证券文档.pdf原文档:

PDF转Word SDK效果对比_Word_10

各SDK厂商处理结果:

  • ComPDFKit: 整体排版正确,第二页的部分字体会出现拖影现象,部分文字会出现超出文本框的现象。\

    PDF转Word SDK效果对比_图文混排_11

  • Foxit:整体排版正确,第二页的部分字体会出现拖影现象,第一页的图表会出现超出文本框的现象。

    PDF转Word SDK效果对比_Word_12

  • Solid:整体排版正确,第一页的图表会出现超出文本框的现象,第一页的页脚图片透明度识别错误。

    PDF转Word SDK效果对比_文本框_13

  • Aspose:整体排版正确,第二页的部分文字下有投影。

    PDF转Word SDK效果对比_Word_14

效果文档 - 论文2.pdf原文档:

PDF转Word SDK效果对比_Word_15

各SDK厂商处理结果:

  • ComPDFKit: 在公式部分的转换都是转换了文档中原有的字符,所以会出现乱码。

    PDF转Word SDK效果对比_Word_16

  • Foxit:并没有区分小标题的粗体与正文的细体,且部分文本用图片代替,排版相对而言比较混乱。

    PDF转Word SDK效果对比_Word_17

  • Solid: 对公式部分的支持比较好,但是部分符号使用了形变后的图片代替,比较影响观感。

    PDF转Word SDK效果对比_文本框_18

效果文档 - 图文混排.pdf原文档:

原文档:

PDF转Word SDK效果对比_Word_19


各SDK厂商处理结果:

图文混排版面都保持的不错ComPDFkit, foxit, solid 文字的字体和原文档都解决得不太好,aspose 最接近, 但是aspose 的背景图片缩放不对。ComPDFkit有几个字最上方被裁掉了。


  • ComPDFKit: 

PDF转Word SDK效果对比_文本框_20

  • foxit: 

PDF转Word SDK效果对比_Word_21

  • Solid:

PDF转Word SDK效果对比_Word_22

  • Aspose:

PDF转Word SDK效果对比_Word_23


效果文档 - 图文带简单表格.pdf

  • foxit 的文字背景形状变了,变成了不规则的。
  • aspose 背景图片变小了。
  • ComPDFKit 的时间有一部分被裁掉了。
  • Solid 效果良好。

原文档:

PDF转Word SDK效果对比_文本框_24

各SDK厂商处理结果:

  • ComPDFKit:

PDF转Word SDK效果对比_文本框_25

  • foxit:

PDF转Word SDK效果对比_图文混排_26

  • Solid:

PDF转Word SDK效果对比_Word_27

  • Aspose:

PDF转Word SDK效果对比_Word_28


总结

这几家 SDK转换PDF为Word都各有优缺点,应该是pdf转成 word 的算法侧重点不同。可以根据自己的项目情况和项目预算选择合适的SDK公司。


【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

KHeYkZhlBPzi