修正版本号

This commit is contained in:
xunbu
2025-06-19 19:20:31 +08:00
parent a7de5bc5b9
commit 7f885542fa
4 changed files with 196 additions and 63 deletions

View File

@@ -28,9 +28,9 @@
1. `uv init`
2. `uv add docutranslate`
3. `uv add docling`#如果需要使用docling进行文档解析
3. `uv add docutranslate[docling]`#如果需要使用docling进行文档解析
使用git
使用git需下载uv
1. `git clone https://github.com/xunbu/docutranslate.git`
2. `uv sync`
@@ -59,9 +59,11 @@
使用minerU将文档转换为markdown时需要在minerU平台申请token
1. 打开[minerU官网](https://mineru.net/apiManage/docs)申请token
1. 打开[minerU官网](https://mineru.net/apiManage/docs)申请API
2. 申请成功后,在[API Token管理界面](https://mineru.net/apiManage/token)创建API Token
> mineru token有14天有效期若过期请创建新的token
## 使用docling引擎注意事项
使用docling将文档转换为markdown时需要下载模型到本地也可以提前下载见FAQ因此可能会遇到一些网络问题
@@ -185,8 +187,8 @@ from docutranslate import FileTranslater
translater = FileTranslater(base_url="<baseurl>", # 默认的模型baseurl
key="<api-key>", # 默认的大语言模型平台api-key
model_id="<model-id>", # 默认的模型id
chunksize=3000, # markdown分块长度单位byte分块越大效果越好也越慢不建议超过8000
max_concurrent=30, # 并发数受到ai平台并发量限制如果文章很长建议适当加大到20以上
chunk_size=3000, # markdown分块长度单位byte分块越大效果越好也越慢不建议超过8000
concurrent=30, # 并发数受到ai平台并发量限制如果文章很长建议适当加大到20以上
timeout=2000, # 调用api的超时时间
docling_artifact=None, # 使用提前下载好的docling模型
convert_engin="mineru", # 可选minerU或docling