字体没嵌进去,文字自动换行就乱套
很多PDF是用微软雅黑或思源黑体导出的,但对方电脑没装同款字体,Word打开时会强制替换成宋体或等线——尤其小字号标题和脚注,一行字突然变成两行,编号全错位。我们试过一份12页的采购合同(含4处楷体批注),用某款本地软件转换后,所有批注缩进偏移2.1字符。解决方法很简单:在PDF生成阶段就勾选‘嵌入全部字体’;如果已经拿到PDF,先用Adobe Acrobat打开,按Ctrl+D看属性页里‘字体’是否标有‘已嵌入’。没嵌入的,别急着转,先用在线工具 /pdftoword 处理,它会自动做字体映射补偿,对中文字体兼容性比多数桌面端强。
扫描件当真PDF用,OCR一错整页废
把手机拍的发票、手写笔记PDF直接拖进转换器,结果出来全是乱码或空格——这不是工具坏了,是它根本没启动OCR识别。真正能读图的工具会在上传后弹窗问‘这是扫描件吗?’,而多数免费网页工具默认跳过这步。我们拿一张A4纸大小、300dpi的扫描合同测试,只有开启‘启用OCR’并手动选‘中文简体’后,表格线才对得上原文列宽。注意:超过50页的扫描PDF建议拆成10页一组传,否则识别引擎容易漏掉页眉页脚的印章位置。
分栏、文本框和页眉页脚,才是隐形雷区
学术论文和企业内刊常用双栏排版,但普通转换器会把左右栏内容串成一长条。更隐蔽的是页眉里的公司logo——看似图片,实际是Word文本框叠在页眉层,一转就掉到底部正文里。还有那种用‘首字下沉+悬挂缩进’做的章节导语,转完只剩一个孤零零的大字卡在段首。遇到这类文件,别硬转。先用 /pdftoword 的‘保留布局’模式试试;若仍错乱,就把PDF打印为‘Microsoft Print to PDF’再转一次,相当于重置页面渲染层。实测对带复杂页眉页脚的20页产品手册,成功率提升60%。

意见反馈
提交成功