labring
diff --git a/‎docSite/assets/imgs/template/Question-answer.png
44.7 KB b/‎docSite/assets/imgs/template/Question-answer.png
44.7 KB
diff --git a/‎docSite/assets/imgs/template/Question-answer_data.png
112 KB b/‎docSite/assets/imgs/template/Question-answer_data.png
112 KB
diff --git a/‎docSite/assets/imgs/template/box.png
18.8 KB b/‎docSite/assets/imgs/template/box.png
18.8 KB
diff --git a/‎docSite/assets/imgs/template/import.png
72.4 KB b/‎docSite/assets/imgs/template/import.png
72.4 KB
diff --git a/‎docSite/assets/imgs/template/import_csv.png
14 KB b/‎docSite/assets/imgs/template/import_csv.png
14 KB
diff --git a/‎docSite/assets/imgs/template/nomal.png
73.7 KB b/‎docSite/assets/imgs/template/nomal.png
73.7 KB
diff --git a/‎docSite/assets/imgs/template/nomal_data.png
113 KB b/‎docSite/assets/imgs/template/nomal_data.png
113 KB
diff --git a/‎docSite/assets/imgs/thirddataset-1.png
162 KB b/‎docSite/assets/imgs/thirddataset-1.png
162 KB
diff --git a/‎docSite/assets/imgs/thirddataset-10.png
228 KB b/‎docSite/assets/imgs/thirddataset-10.png
228 KB
diff --git a/‎docSite/assets/imgs/thirddataset-11.png
63.6 KB b/‎docSite/assets/imgs/thirddataset-11.png
63.6 KB
diff --git a/‎docSite/assets/imgs/thirddataset-12.png
48.9 KB b/‎docSite/assets/imgs/thirddataset-12.png
48.9 KB
diff --git a/‎docSite/assets/imgs/thirddataset-13.png
38.5 KB b/‎docSite/assets/imgs/thirddataset-13.png
38.5 KB
diff --git a/‎docSite/assets/imgs/thirddataset-14.png
73.2 KB b/‎docSite/assets/imgs/thirddataset-14.png
73.2 KB
diff --git a/‎docSite/assets/imgs/thirddataset-15.png
61.9 KB b/‎docSite/assets/imgs/thirddataset-15.png
61.9 KB
diff --git a/‎docSite/assets/imgs/thirddataset-16.png
26.5 KB b/‎docSite/assets/imgs/thirddataset-16.png
26.5 KB
diff --git a/‎docSite/assets/imgs/thirddataset-17.png
29.4 KB b/‎docSite/assets/imgs/thirddataset-17.png
29.4 KB
diff --git a/‎docSite/assets/imgs/thirddataset-18.png
33.2 KB b/‎docSite/assets/imgs/thirddataset-18.png
33.2 KB
diff --git a/‎docSite/assets/imgs/thirddataset-19.png
206 KB b/‎docSite/assets/imgs/thirddataset-19.png
206 KB
diff --git a/‎docSite/assets/imgs/thirddataset-2.png
207 KB b/‎docSite/assets/imgs/thirddataset-2.png
207 KB
diff --git a/‎docSite/assets/imgs/thirddataset-20.png
188 KB b/‎docSite/assets/imgs/thirddataset-20.png
188 KB
diff --git a/‎docSite/assets/imgs/thirddataset-21.png
197 KB b/‎docSite/assets/imgs/thirddataset-21.png
197 KB
diff --git a/‎docSite/assets/imgs/thirddataset-3.png
159 KB b/‎docSite/assets/imgs/thirddataset-3.png
159 KB
diff --git a/‎docSite/assets/imgs/thirddataset-4.png
173 KB b/‎docSite/assets/imgs/thirddataset-4.png
173 KB
diff --git a/‎docSite/assets/imgs/thirddataset-5.png
103 KB b/‎docSite/assets/imgs/thirddataset-5.png
103 KB
diff --git a/‎docSite/assets/imgs/thirddataset-6.png
144 KB b/‎docSite/assets/imgs/thirddataset-6.png
144 KB
diff --git a/‎docSite/assets/imgs/thirddataset-7.png
6.03 KB b/‎docSite/assets/imgs/thirddataset-7.png
6.03 KB
diff --git a/‎docSite/assets/imgs/thirddataset-8.png
110 KB b/‎docSite/assets/imgs/thirddataset-8.png
110 KB
diff --git a/‎docSite/assets/imgs/thirddataset-9.png
140 KB b/‎docSite/assets/imgs/thirddataset-9.png
140 KB
diff --git a/‎docSite/content/zh-cn/docs/development/openapi/dataset.md
Lines changed: 11 additions & 23 deletions b/‎docSite/content/zh-cn/docs/development/openapi/dataset.md
Lines changed: 11 additions & 23 deletions
diff --git a/‎docSite/content/zh-cn/docs/development/upgrading/491.md
Lines changed: 1 addition & 1 deletion b/‎docSite/content/zh-cn/docs/development/upgrading/491.md
Lines changed: 1 addition & 1 deletion
diff --git a/‎docSite/content/zh-cn/docs/development/upgrading/4911.md
Lines changed: 23 additions & 3 deletions b/‎docSite/content/zh-cn/docs/development/upgrading/4911.md
Lines changed: 23 additions & 3 deletions
diff --git a/‎docSite/content/zh-cn/docs/development/upgrading/494.md
Lines changed: 1 addition & 1 deletion b/‎docSite/content/zh-cn/docs/development/upgrading/494.md
Lines changed: 1 addition & 1 deletion
diff --git a/‎docSite/content/zh-cn/docs/guide/knowledge_base/template.md
Lines changed: 118 additions & 0 deletions b/‎docSite/content/zh-cn/docs/guide/knowledge_base/template.md
Lines changed: 118 additions & 0 deletions
@@ -295,12 +295,15 @@ curl --location --request DELETE 'http://localhost:3000/api/core/dataset/delete?
 | --- | --- | --- |
 | datasetId | 知识库ID | ✅ |
 | parentId： | 父级ID，不填则默认为根目录 |  |
-| trainingType | 数据处理方式。chunk: 按文本长度进行分割;qa: 问答对提取 | ✅ |
 | customPdfParse | PDF增强解析。true: 开启PDF增强解析;不填则默认为false |  |
+| trainingType | 数据处理方式。chunk: 按文本长度进行分割;qa: 问答对提取 | ✅ |
+| chunkTriggerType | 分块条件逻辑。minSize（默认）: 大于 n 时分块;maxSize: 小于文件处理模型最大上下文时分块;forceChunk: 强制分块 | |
+| chunkTriggerMinSize | chunkTriggerType=minSize 时候填写，原文长度大于该值时候分块（默认 1000） | |
 | autoIndexes | 是否自动生成索引(仅商业版支持) |  |
 | imageIndex | 是否自动生成图片索引(仅商业版支持) |  |
 | chunkSettingMode | 分块参数模式。auto: 系统默认参数; custom: 手动指定参数 |  |
-| chunkSplitMode | 分块拆分模式。size: 按长度拆分; char: 按字符拆分。chunkSettingMode=auto时不生效。 |  |
+| chunkSplitMode | 分块拆分模式。paragraph：段落优先，再按长度分；size: 按长度拆分; char: 按字符拆分。chunkSettingMode=auto时不生效。 |  |
+| paragraphChunkDeep | 最大段落深度（默认 5） | |
 | chunkSize | 分块大小，默认 1500。chunkSettingMode=auto时不生效。 |  |
 | indexSize | 索引大小，默认 512，必须小于索引模型最大token。chunkSettingMode=auto时不生效。 |  |
 | chunkSplitter | 自定义最高优先分割符号，除非超出文件处理最大上下文，否则不会进行进一步拆分。chunkSettingMode=auto时不生效。 |  |
@@ -428,10 +431,7 @@ data 为集合的 ID。
   "data": {
       "collectionId": "65abcfab9d1448617cba5f0d",
       "results": {
-          "insertLen": 5, // 分割成多少段
-          "overToken": [],
-          "repeat": [],
-          "error": []
+          "insertLen": 5 // 分割成多少段
       }
   }
 }
@@ -497,10 +497,7 @@ data 为集合的 ID。
     "data": {
         "collectionId": "65abd0ad9d1448617cba6031",
         "results": {
-            "insertLen": 1,
-            "overToken": [],
-            "repeat": [],
-            "error": []
+            "insertLen": 1
         }
     }
 }
@@ -546,7 +543,7 @@ curl --location --request POST 'http://localhost:3000/api/core/dataset/collectio
 {{< tab tabName="响应示例" >}}
 {{< markdownify >}}
 
-data 为集合的 ID。
+由于解析文档是异步操作，此处不会返回插入的数量。
 
 ```json
 {
@@ -556,10 +553,7 @@ data 为集合的 ID。
     "data": {
         "collectionId": "65abc044e4704bac793fbd81",
         "results": {
-            "insertLen": 1,
-            "overToken": [],
-            "repeat": [],
-            "error": []
+            "insertLen": 0
         }
     }
 }
@@ -632,10 +626,7 @@ data 为集合的 ID。
     "data": {
         "collectionId": "65abc044e4704bac793fbd81",
         "results": {
-            "insertLen": 1,
-            "overToken": [],
-            "repeat": [],
-            "error": []
+            "insertLen": 1
         }
     }
 }
@@ -702,10 +693,7 @@ data 为集合的 ID。
   "data": {
     "collectionId": "6646fcedfabd823cdc6de746",
     "results": {
-        "insertLen": 1,
-        "overToken": [],
-        "repeat": [],
-        "error": []
+        "insertLen": 1
     }
   }
 }
 
@@ -1,5 +1,5 @@
 ---
-title: 'V4.9.1'
+title: 'V4.9.1(包含升级脚本)'
 description: 'FastGPT V4.9.1 更新说明'
 icon: 'upgrade'
 draft: false
 
@@ -7,11 +7,29 @@ toc: true
 weight: 789
 ---
 
+## 执行升级脚本
+
+该脚本仅需商业版用户执行。
+
+从任意终端，发起 1 个 HTTP 请求。其中 {{rootkey}} 替换成环境变量里的 `rootkey`；{{host}} 替换成**FastGPT 域名**。
+
+```bash
+curl --location --request POST 'https://{{host}}/api/admin/initv4911' \
+--header 'rootkey: {{rootkey}}' \
+--header 'Content-Type: application/json'
+```
+
+**脚本功能**
+
+1. 移动第三方知识库 API 配置。
 
 ## 🚀 新增内容
 
-1. 工作流中增加节点搜索功能。
-2. 工作流中，子流程版本控制，可选择“保持最新版本”，无需手动更新。
+1. 商业版支持图片知识库。
+2. 工作流中增加节点搜索功能。
+3. 工作流中，子流程版本控制，可选择“保持最新版本”，无需手动更新。
+4. 增加更多审计操作日志。
+5. 知识库增加文档解析异步队列，导入文档时，无需等待文档解析完毕才进行导入。
 
 ## ⚙️ 优化
 
@@ -22,4 +40,6 @@ weight: 789
 1. 工作流中，管理员声明的全局系统工具，无法进行版本管理。
 2. 工具调用节点前，有交互节点时，上下文异常。
 3. 修复备份导入，小于 1000 字时，无法分块问题。
-4. 自定义 PDF 解析，无法保存 base64 图片。
+4. 自定义 PDF 解析，无法保存 base64 图片。
+5. 非流请求，未进行 CITE 标记替换。
+6. Python 沙盒存在隐藏风险。
@@ -1,5 +1,5 @@
 ---
-title: 'V4.9.4'
+title: 'V4.9.4(包含升级脚本)'
 description: 'FastGPT V4.9.4 更新说明'
 icon: 'upgrade'
 draft: false
 
@@ -0,0 +1,118 @@
+---
+title: '模板导入'
+description: 'FastGPT 模板导入功能介绍和使用方式'
+icon: 'language'
+draft: false
+toc: true
+weight: 420
+---
+
+
+## 背景
+
+FastGPT 提供了模板导入功能，让用户可以通过预设的 CSV 模板格式批量导入问答对数据。这种方式特别适合已经有结构化问答数据的用户，可以快速将数据导入到知识库中。
+
+## 模板结构说明
+
+模板采用 CSV 格式，包含以下列：
+
+- q: 问题列，存放用户可能提出的问题
+- a: 答案列，存放对应问题的标准答案
+- indexes: 索引列，用于存放与该问题相关的索引
+
+### 示例数据
+
+```csv
+q,a,indexes
+"你是谁呀？","我呀，是 AI 小助手哟，专门在这儿随时准备着，陪你交流、为你答疑解惑，不管是学习上的知识探讨，生活里的小疑问，还是创意灵感的碰撞，我都能尽力参与，用我的 "知识大脑" 给你提供帮助和陪伴呢，就盼着能成为你互动交流、探索世界的好伙伴呀 。","1. 你是什么？\n2. 你能做什么？\n3. 你可以解答哪些方面的疑问？\n4. 你希望成为什么样的伙伴？\n5. 你如何提供帮助？"
+"你是什么？","我是 AI 小助手，专门随时准备陪用户交流、为用户答疑解惑，能参与学习上的知识探讨、生活里的小疑问以及创意灵感的碰撞，用 "知识大脑" 提供帮助和陪伴，希望成为用户互动交流、探索世界的好伙伴。","你是什么？"
+"你能做什么？","能陪用户交流、为用户答疑解惑，参与学习上的知识探讨、生活里的小疑问以及创意灵感的碰撞，用 "知识大脑" 提供帮助和陪伴。","你能做什么？"
+```
+
+## 使用说明
+
+### 1. 打开知识库，点击导入，选择模版导入
+
+![](/imgs/template/import.png)
+
+![](/imgs/template/box.png)
+
+### 2. 下载模板
+
+点击下载 CSV 模版，其中存在两个模式的内容
+
+#### 常规模式的数据模版
+
+![](/imgs/template/nomal.png)
+
+对应 CSV 格式为
+
+![](/imgs/template/nomal_data.png)
+
+常规模式下，q为内容，a为空，indexes可多个
+
+#### 问答对的数据模版
+
+![](/imgs/template/Question-answer.png)
+
+对应CSV格式为
+
+![](/imgs/template/Question-answer_data.png)
+
+问答对模式下，q为问题，a为答案，indexes即为索引部分
+
+### 3. 填写数据
+
+按照模板格式填写你的问答数据：
+- 每一行代表一个内容或者一个问答对
+- 问题(q)始终不为空
+- 在一行内，索引部分可往后继续添加
+
+### 4. 导入限制
+
+- 仅支持 CSV 格式文件
+- 单个文件大小限制为 100MB
+- 必须严格按照模板格式填写，否则可能导入失败
+- 每次只能导入一个文件
+
+成功导入后如下：
+
+![](/imgs/template/import_csv.png)
+
+### 4. 注意事项
+
+- 确保 CSV 文件使用 UTF-8 编码
+- 如果内容中包含逗号，请用双引号包裹整个内容
+- indexes 列的内容会被用作相关问题的索引，有助于提高检索准确性
+- 建议在导入大量数据前先测试少量数据
+
+## 最佳实践
+
+1. **数据准备**
+   - 确保内容或者问答对的质量，答案应该清晰、准确
+   - 为每个导入的添加合适的索引关键词
+   - 避免重复的内容或者问答对
+
+2. **格式检查**
+   - 导入前检查 CSV 文件格式是否正确
+   - 确保没有多余的空行或空格
+   - 验证特殊字符是否正确转义
+
+3. **分批导入**
+   - 如果数据量较大，建议分批导入
+   - 每批导入后验证数据的正确性
+
+## 常见问题
+
+Q: 为什么我的文件导入失败了？
+A: 请检查以下几点：
+- 文件格式是否为 CSV
+- 编码是否为 UTF-8
+- 是否严格按照模板格式填写
+- 文件大小是否超过限制
+
+Q: 如何验证导入是否成功？
+A: 导入成功后，你可以：
+- 在知识库中搜索导入的问题
+- 通过对话测试回答的准确性
+- 查看知识库的数据统计
Original file line number	Diff line number	Diff line change
`@@ -295,12 +295,15 @@ curl --location --request DELETE 'http://localhost:3000/api/core/dataset/delete?`
`295`	`295`	`\| --- \| --- \| --- \|`
`296`	`296`	`\| datasetId \| 知识库ID \| ✅ \|`
`297`	`297`	`\| parentId： \| 父级ID，不填则默认为根目录 \| \|`
`298`		`-\| trainingType \| 数据处理方式。chunk: 按文本长度进行分割;qa: 问答对提取 \| ✅ \|`
`299`	`298`	`\| customPdfParse \| PDF增强解析。true: 开启PDF增强解析;不填则默认为false \| \|`
	`299`	`+\| trainingType \| 数据处理方式。chunk: 按文本长度进行分割;qa: 问答对提取 \| ✅ \|`
	`300`	`+\| chunkTriggerType \| 分块条件逻辑。minSize（默认）: 大于 n 时分块;maxSize: 小于文件处理模型最大上下文时分块;forceChunk: 强制分块 \| \|`
	`301`	`+\| chunkTriggerMinSize \| chunkTriggerType=minSize 时候填写，原文长度大于该值时候分块（默认 1000） \| \|`
`300`	`302`	`\| autoIndexes \| 是否自动生成索引(仅商业版支持) \| \|`
`301`	`303`	`\| imageIndex \| 是否自动生成图片索引(仅商业版支持) \| \|`
`302`	`304`	`\| chunkSettingMode \| 分块参数模式。auto: 系统默认参数; custom: 手动指定参数 \| \|`
`303`		`-\| chunkSplitMode \| 分块拆分模式。size: 按长度拆分; char: 按字符拆分。chunkSettingMode=auto时不生效。 \| \|`
	`305`	`+\| chunkSplitMode \| 分块拆分模式。paragraph：段落优先，再按长度分；size: 按长度拆分; char: 按字符拆分。chunkSettingMode=auto时不生效。 \| \|`
	`306`	`+\| paragraphChunkDeep \| 最大段落深度（默认 5） \| \|`
`304`	`307`	`\| chunkSize \| 分块大小，默认 1500。chunkSettingMode=auto时不生效。 \| \|`
`305`	`308`	`\| indexSize \| 索引大小，默认 512，必须小于索引模型最大token。chunkSettingMode=auto时不生效。 \| \|`
`306`	`309`	`\| chunkSplitter \| 自定义最高优先分割符号，除非超出文件处理最大上下文，否则不会进行进一步拆分。chunkSettingMode=auto时不生效。 \| \|`
`@@ -428,10 +431,7 @@ data 为集合的 ID。`
`428`	`431`	`"data": {`
`429`	`432`	`"collectionId": "65abcfab9d1448617cba5f0d",`
`430`	`433`	`"results": {`
`431`		`- "insertLen": 5, // 分割成多少段`
`432`		`- "overToken": [],`
`433`		`- "repeat": [],`
`434`		`- "error": []`
	`434`	`+ "insertLen": 5 // 分割成多少段`
`435`	`435`	`}`
`436`	`436`	`}`
`437`	`437`	`}`
`@@ -497,10 +497,7 @@ data 为集合的 ID。`
`497`	`497`	`"data": {`
`498`	`498`	`"collectionId": "65abd0ad9d1448617cba6031",`
`499`	`499`	`"results": {`
`500`		`- "insertLen": 1,`
`501`		`- "overToken": [],`
`502`		`- "repeat": [],`
`503`		`- "error": []`
	`500`	`+ "insertLen": 1`
`504`	`501`	`}`
`505`	`502`	`}`
`506`	`503`	`}`
`@@ -546,7 +543,7 @@ curl --location --request POST 'http://localhost:3000/api/core/dataset/collectio`
`546`	`543`	`{{< tab tabName="响应示例" >}}`
`547`	`544`	`{{< markdownify >}}`
`548`	`545`
`549`		`-data 为集合的 ID。`
	`546`	`+由于解析文档是异步操作，此处不会返回插入的数量。`
`550`	`547`
`551`	`548`	```json
`552`	`549`	`{`
`@@ -556,10 +553,7 @@ data 为集合的 ID。`
`556`	`553`	`"data": {`
`557`	`554`	`"collectionId": "65abc044e4704bac793fbd81",`
`558`	`555`	`"results": {`
`559`		`- "insertLen": 1,`
`560`		`- "overToken": [],`
`561`		`- "repeat": [],`
`562`		`- "error": []`
	`556`	`+ "insertLen": 0`
`563`	`557`	`}`
`564`	`558`	`}`
`565`	`559`	`}`
`@@ -632,10 +626,7 @@ data 为集合的 ID。`
`632`	`626`	`"data": {`
`633`	`627`	`"collectionId": "65abc044e4704bac793fbd81",`
`634`	`628`	`"results": {`
`635`		`- "insertLen": 1,`
`636`		`- "overToken": [],`
`637`		`- "repeat": [],`
`638`		`- "error": []`
	`629`	`+ "insertLen": 1`
`639`	`630`	`}`
`640`	`631`	`}`
`641`	`632`	`}`
`@@ -702,10 +693,7 @@ data 为集合的 ID。`
`702`	`693`	`"data": {`
`703`	`694`	`"collectionId": "6646fcedfabd823cdc6de746",`
`704`	`695`	`"results": {`
`705`		`- "insertLen": 1,`
`706`		`- "overToken": [],`
`707`		`- "repeat": [],`
`708`		`- "error": []`
	`696`	`+ "insertLen": 1`
`709`	`697`	`}`
`710`	`698`	`}`
`711`	`699`	`}`