|
|
4893163221
|
fix: 彻底移除MT批处理,qwen-mt模型会破坏所有文本分隔符
日志证实: \n\n---\n\n分隔符被MT模型破坏率82%(28/34批次)
MT模型逐条翻译是唯一可靠方案,无法批处理
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-06-08 16:39:47 +08:00 |
|
|
|
4f6bd1bc7b
|
fix: MT批处理增加计数校验,不匹配时自动逐条回退
- MT_BATCH_SEP改为\n\n---\n\n,MT模型更不容易破坏
- _apply_mt_batch_results: 校验每批split count是否匹配预期
- 不匹配时标记为mismatched,_retranslate_mismatched逐条重译
- 批处理速度+逐条可靠性,两全兼顾
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-06-08 16:10:14 +08:00 |
|
|
|
a8b8c416dd
|
fix: MT批处理+原项目功能合并,616段→21批
- segments_agent.py: MT模式用\n\n自然段落分隔批处理替代逐条发送
_batch_segments_for_mt: 按chunk_size分批,\n\n连接段落
_mt_batch_result_handler: 按\n\n拆分翻译结果回映射
616段→21批(减少96.6% API调用),翻译速度从~6分钟→~1分钟
- docx_translator.py: 合并原项目功能
+is_instr_text_run: 跳过w:instrText域代码,防止TOC/页码被破坏
+_decrypt_if_needed: 支持密码加密的docx
+office_password配置项
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-06-08 15:49:01 +08:00 |
|
|
|
4cf1a8c67d
|
fix: MT模式改为逐条翻译,彻底消除标记依赖和29.4%内容丢失
- MT模式不再打包segment为<<<SEG:n>>>标记格式
- 改为每个segment一次纯文本API调用,1:1映射,零标记零解析
- 删除_chunk_to_mt_prompt/_parse_mt_response/_result_handler_mt等~100行死代码
- 新增_mt_simple_result_handler/_mt_simple_error_handler
- 非MT模式(JSON批处理)不受影响
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-06-08 15:20:06 +08:00 |
|
|
|
52bb8858c8
|
fix: 翻译前合并相邻同格式Run,解决Word微观Run碎片导致的格式混乱
- 新增_run_format_key(): 生成Run格式签名(bold/italic/size/color/font)
- 新增_merge_adjacent_runs(): 合并相邻同格式Run,减少Run碎片
- P91从42个Run合并为4个(2格式交替),P92从50个合并为1个
- 合并后翻译比例分配不再丢失内容和格式
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-06-08 15:00:31 +08:00 |
|
|
|
7f02abae0e
|
fix: 印尼语在未更新i18nData.json的服务器上回退到en而非zh
- onMounted: 若id语言包缺失,自动使用en作为回退(而非显示中文)
- t(): 默认回退语言从zh改为en(英语比中文更通用)
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-06-08 14:53:25 +08:00 |
|
|
|
97b7b20565
|
fix: 印尼语fallback缺失 + docx格式100%保留
- index.html: catch块增加id回退、setLang动态更新title、标题栏初始化
- docx_translator.py: 从分段翻译改为段落级翻译,Run结构100%保留
删除SIGNIFICANT_STYLES/is_tab_run/_process_element_children等~120行死代码
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-06-08 14:43:54 +08:00 |
|
|
|
8a5f62342a
|
fix: MT模式翻译残留、docx格式丢失、语言切换器及provider域名修复
- provider.py: 域名匹配改为包含匹配,覆盖dashscope-intl国际站
- segments_agent.py: MT模式改用<<<SEG:n>>>纯文本标记替代JSON,避免qwen-mt模型原文残留
- docx_translator.py: _apply_translation改为按字符比例分配译文到各Run,保留原始格式
- i18nData.json: vi(越南语)替换为id(印尼语),含完整175键翻译
- index.html: 语言切换器移至顶部标题栏,新增浏览器语言自动检测
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-06-08 14:07:13 +08:00 |
|
r-earth-or
|
9d8eacf0b4
|
feat:前端不显示模型api-key
隐藏GitHub链接
|
2026-04-15 13:57:05 +08:00 |
|
r-earth-or
|
47a3e9126a
|
feat:自动根据环境变量填写前端输入项,支持术语表与领域知识
|
2026-04-07 13:20:43 +08:00 |
|
toy
|
9e82daa2a1
|
feat:兼容qwen-mt模型
|
2026-02-10 15:50:42 +08:00 |
|
xunbu
|
86a9958f58
|
添加依赖
|
2026-01-19 10:08:54 +08:00 |
|
xunbu
|
cd218a5ad0
|
增加regex
|
2026-01-19 09:52:22 +08:00 |
|
xunbu
|
6a2563bed6
|
修改备注
|
2026-01-18 23:56:08 +08:00 |
|
xunbu
|
2c7e879cd5
|
还原gemini的baseurl
|
2026-01-18 23:55:48 +08:00 |
|
xunbu
|
a6fe62420a
|
更新版本
|
2026-01-18 23:54:17 +08:00 |
|
xunbu
|
93009d70a9
|
优化pptx翻译效果
|
2026-01-18 23:50:58 +08:00 |
|
xunbu
|
5871f5dd85
|
修复gemini供应商标识
|
2026-01-18 21:13:57 +08:00 |
|
xunbu
|
8e91475e5c
|
修复gemini供应商标识
|
2026-01-18 21:04:00 +08:00 |
|
xunbu
|
95b71fd884
|
Merge branch 'main' of https://github.com/xunbu/docutranslate
|
2026-01-17 17:33:42 +08:00 |
|
xunbu
|
010ef31372
|
使用charset_normalizer替代chardet
|
2026-01-17 17:32:25 +08:00 |
|
xunbu
|
e502fa3a81
|
Merge pull request #21 from dominhhieu1405/main
Add Vietnamese language support.
|
2026-01-13 11:20:24 +08:00 |
|
Luce
|
c83a5ec906
|
Add Vietnamese
|
2026-01-13 00:47:35 +07:00 |
|
Luce
|
f112da27a4
|
Add Vietnamese localization strings to i18nData.json
|
2026-01-13 00:34:50 +07:00 |
|
Luce
|
e16a6fa3ae
|
Add Vietnamese language link to README
|
2026-01-13 00:25:49 +07:00 |
|
Luce
|
d91a523582
|
Add Vietnamese language link to README
|
2026-01-13 00:25:34 +07:00 |
|
Luce
|
a9d761ea10
|
Add Vietnamese language link to README
|
2026-01-13 00:25:12 +07:00 |
|
Luce
|
408116b963
|
Add Vietnamese README with project details
|
2026-01-13 00:24:46 +07:00 |
|
xunbu
|
96e9404a76
|
优化html目录生成效率
|
2026-01-11 19:31:50 +08:00 |
|
xunbu
|
d04fb90314
|
update
|
2026-01-11 13:50:44 +08:00 |
|
xunbu
|
253eb00510
|
update
|
2026-01-11 13:38:45 +08:00 |
|
xunbu
|
3f827067fe
|
update
|
2026-01-11 13:03:31 +08:00 |
|
xunbu
|
98ac573a13
|
修复术语表问题
|
2026-01-11 13:03:02 +08:00 |
|
xunbu
|
65eaf514ef
|
修复不能使用用户术语表的问题
|
2026-01-11 12:08:17 +08:00 |
|
xunbu
|
6e594c74e1
|
修复类型注解错误
|
2026-01-11 00:13:47 +08:00 |
|
xunbu
|
7778491960
|
提高token计算精度
|
2026-01-10 23:49:59 +08:00 |
|
xunbu
|
bef797fdc2
|
移除tiktoken依赖
|
2026-01-10 23:40:40 +08:00 |
|
xunbu
|
520adf6fd5
|
修复未更新的workflow
|
2026-01-09 20:44:25 +08:00 |
|
xunbu
|
17f946612c
|
更新术语表bug
|
2026-01-09 18:00:16 +08:00 |
|
xunbu
|
8ed3749435
|
更新版本
|
2026-01-09 17:31:06 +08:00 |
|
xunbu
|
3b13157670
|
支持mineru 2.7.1
|
2026-01-07 19:56:27 +08:00 |
|
xunbu
|
50255069b7
|
优化目录效果
|
2026-01-07 00:17:51 +08:00 |
|
xunbu
|
cd500c50c5
|
update
|
2026-01-07 00:12:13 +08:00 |
|
xunbu
|
5a98578596
|
update
|
2026-01-06 23:25:03 +08:00 |
|
xunbu
|
5725a298a0
|
js/css嵌入
|
2026-01-06 22:48:27 +08:00 |
|
xunbu
|
2d0f249ee7
|
html自动生成目录
|
2026-01-06 20:22:26 +08:00 |
|
xunbu
|
dfa94aac9d
|
修复可能的ai无限回复时出现的问题
|
2026-01-06 19:45:55 +08:00 |
|
xunbu
|
8127ef8267
|
自动生成术语表不覆盖用户术语表,最终下载的是合并术语表
|
2026-01-05 23:58:57 +08:00 |
|
xunbu
|
ea24f7db31
|
增加stop标记检测与续传
|
2026-01-05 23:48:40 +08:00 |
|
xunbu
|
a93ab74ce1
|
update
|
2026-01-01 05:13:32 +08:00 |
|