翻译合同PDF时格式乱了?这几种文件类型能原样保留排版

合同PDF一翻译就跑版,问题出在字体嵌入和段落锚点

上周帮法务同事处理一份47页的英文采购协议PDF,用某在线工具翻译后,条款编号全挤到页尾,页眉的公司Logo变成方框,连签字栏都缩进了右下角。后来查清原因:原始PDF用了非标准字体(如Helvetica Neue Bold),且未嵌入字形;更关键的是,工具把‘段落样式’当纯文本切开,丢失了‘保持与上一段同页’这类排版指令。我们试了三类方案——直接OCR识别再译、先转Word再译、用支持样式映射的本地软件,最终选了后者,耗时22分钟,格式还原度达95%。

DOCX里带批注和修订痕迹,翻译前得先‘收掉’

很多人忽略Word文档里的隐藏层。比如销售部发来的报价单DOCX,表面看只有表格,但打开‘审阅’→‘显示标记’,会发现12处修订记录和7条批注。这些内容若未经处理直接送译,有些工具会把‘[建议删除]’这类说明也翻成英文,甚至把批注框当成正文段落。正确做法是:先点击‘接受所有修订’,再选‘删除所有批注’,最后另存为纯净DOCX。我们测试过,含修订痕迹的文件在翻译后,表格列宽常被自动重设,尤其当原文用‘固定列宽’而非‘根据内容调整’时,错位概率超七成。

XLSX翻译表格,别让合并单元格变成‘空行炸弹’

财务部常遇到的坑:Excel里合并了A1:C1写‘2024年度预算汇总’,翻译工具却把它拆成三列独立单元格,后面数据全往下错一行。根本原因是,多数轻量级翻译器不解析Excel的‘MergeCells’属性,而是按行列索引硬读。解决办法很简单:翻译前用PDF转Excel工具导出时勾选‘保留合并单元格’,或手动在Excel里复制整行→选择性粘贴为‘值’,再对纯数据表操作。另外提醒,含公式的单元格(如‘=SUM(B2:B10)’)千万别翻译公式本身,只译旁边标注文字,否则后期校验会漏掉计算逻辑。

TXT虽简单,但编码容易翻车。比如日文说明书用Shift-JIS编码保存,直接拖进翻译框会变乱码,需先用记事本‘另存为’UTF-8。我们实测过,2MB以内的TXT文件基本无压力;超过5MB,部分工具会截断末尾段落,建议拆分成单个章节再处理。所有格式中,PDF最难控,但只要避开‘扫描图转文字’这种OCR粗粒度操作,优先用支持向量图形识别的工具,排版稳定性反而比DOCX更稳。

好翻译 · 好办公

AI 翻译、PDF 转换、智能抠图等 20+ 免费在线工具,无需安装,打开即用

免费使用工具
意见反馈