处理200页PDF合同前，先做这三件事省下两小时

翻译技巧好翻译编辑部 2026-05-27 21:03 阅读 56

先别急着点‘开始转换’

上周帮法务同事处理一份198页的双语采购合同，扫描件分辨率只有150dpi，直接拖进某在线PDF转Word工具，结果第37页起所有表格全塌成一列文字，页眉页脚错位到正文里，连中英文混排的顿号都变成了乱码。其实问题出在第一步——没做预处理。扫描件若带阴影、倾斜或局部模糊，OCR引擎会把‘¥’认成‘Y’，把‘0’当成‘O’。我们习惯用手机拍完直接上传，但更稳的做法是：用‘PDF压缩’工具先做一次无损重采样，选‘增强文字清晰度’选项（不是‘自动优化’），尤其对公章压字区域能明显提升识别率。这个动作花不了1分钟，却能让后续转换准确率从62%提到89%。

表格别指望一键搞定

财务部常传来的报销单、供应商清单，多是扫描件嵌套表格。直接转Excel？大概率出现合并单元格炸开、表头错行、数字带空格。我们试过7个工具，发现最靠谱的路径是：先用PDF转Excel跑一遍基础结构，再人工检查第1、5、12页（这三个位置最容易因扫描歪斜导致列偏移）。重点盯住金额列——如果出现‘1,234.00’变成‘1 234.00’或‘1234.00 ’，说明OCR把逗号/空格当分隔符了，这时得返回原始PDF，用Adobe Acrobat的‘导出为电子表格’功能重新导，或者把那几页单独截图后走‘图片格式转换’转成PNG再识别。别小看这一步，有次我们因此少改了47处数据错误。

译文排版卡在最后十分钟

翻译完的Word文档要交客户，却发现中英对照表头字号不一致、项目符号缩进错乱、甚至某些段落首行缩进变成2字符+空格。问题常出在PDF转Word时保留了原始PDF的隐藏样式标记。解决办法很土但管用：全选→清除格式（Ctrl+Space）→手动重建标题层级。如果文档含大量图片（比如产品说明书里的示意图），千万别用‘复制粘贴’挪图——容易失真或丢失Alt文本。这时用人像抠图工具的‘智能去背景’功能反而更稳，它能把图中文字标注和图标精准分离，再插入Word时尺寸不会跑。我们处理过一份含63张设备图的德译中手册，用这个方法比手动调图快了近40分钟，且客户反馈‘图表边缘干净’。

翻译技巧办公效率 PDF处理

先别急着点‘开始转换’

表格别指望一键搞定

译文排版卡在最后十分钟

好翻译 · 好办公

意见反馈