优化docx翻译
This commit is contained in:
@@ -33,17 +33,15 @@ def is_image_run(run: Run) -> bool:
|
||||
# ==================== MODIFICATION START ====================
|
||||
# 对 is_formatting_only_run 函数进行了修改
|
||||
# 旧的实现无法识别仅包含颜色等 rPr 属性的空 Run,导致其与后续文本 Run 错误合并。
|
||||
# 新的实现通过一个更简单的标准来判断:只要一个 Run 的文本内容在去除空白后为空,
|
||||
# 它就被认为是纯格式化的,从而解决了交叉引用文本消失的问题。
|
||||
# # 新的实现通过一个更简单的标准来判断:只要一个 Run 的文本内容为空,
|
||||
# # 它就被认为是纯格式化的,从而解决了交叉引用文本消失的问题。
|
||||
# ==========================================================
|
||||
def is_formatting_only_run(run: Run) -> bool:
|
||||
"""
|
||||
检查一个 Run 是否仅用于格式化,不包含应被翻译的实质性文本。
|
||||
这包括:
|
||||
- 完全没有文本的 Run (即使它带有颜色等格式)。
|
||||
- 只包含空格、制表符等空白字符的 Run。
|
||||
检查一个 Run 是否仅用于格式化,不包含任何应被渲染的文本。
|
||||
这仅适用于其 .text 属性为 "" 的情况。
|
||||
"""
|
||||
return not run.text.strip()
|
||||
return run.text == ""
|
||||
|
||||
|
||||
# ===================== MODIFICATION END =====================
|
||||
|
||||
Reference in New Issue
Block a user