优化docx翻译

This commit is contained in:
xunbu
2025-10-17 12:06:09 +08:00
parent 3ac6e9fc1d
commit f611eb8501
2 changed files with 7 additions and 8 deletions

View File

@@ -33,17 +33,15 @@ def is_image_run(run: Run) -> bool:
# ==================== MODIFICATION START ====================
# 对 is_formatting_only_run 函数进行了修改
# 旧的实现无法识别仅包含颜色等 rPr 属性的空 Run导致其与后续文本 Run 错误合并。
# 新的实现通过一个更简单的标准来判断:只要一个 Run 的文本内容在去除空白后为空,
# 它就被认为是纯格式化的,从而解决了交叉引用文本消失的问题。
# # 新的实现通过一个更简单的标准来判断:只要一个 Run 的文本内容为空,
# # 它就被认为是纯格式化的,从而解决了交叉引用文本消失的问题。
# ==========================================================
def is_formatting_only_run(run: Run) -> bool:
"""
检查一个 Run 是否仅用于格式化,不包含应被翻译的实质性文本。
包括:
- 完全没有文本的 Run (即使它带有颜色等格式)。
- 只包含空格、制表符等空白字符的 Run。
检查一个 Run 是否仅用于格式化,不包含任何应被渲染的文本。
仅适用于其 .text 属性为 "" 的情况。
"""
return not run.text.strip()
return run.text == ""
# ===================== MODIFICATION END =====================