🤖 AI总结
主题
ragflow v0.25.6版本发布,涵盖Agent、RAG、API、安全性等多个模块的综合性更新。
摘要
ragflow v0.25.6发布,Agent新增Browser组件,RAG RAPTOR升级至AHC模式,修复多项问题并扩展Go生态,全面提升稳定性与安全性。
关键信息
- 1 Agent新增Browser组件和@tool装饰器
- 2 RAG RAPTOR引入AHC模式,性能与召回提升
- 3 修复大量异步、解析、安全、API问题
![]()
![]()
![]()
一、版本概览
ragflow v0.25.6 于2026年5月26日发布,是一次覆盖Agent、RAG、API、Go 驱动、文档解析、异步调度、权限安全、国际化等多个模块的综合性更新。
从这次发布内容来看,v0.25.6 并不是单点功能补丁,而是一次明显偏向能力补齐、体验增强、问题修复、生态扩展的版本升级。
本次版本最值得关注的方向包括:
•Agent 新增 Browser 组件,让 AI 能够自主浏览和操作网页
•RAG RAPTOR 构建升级到 AHC 模式,语义扩展从文档级别提升到数据集级别
•Agent 新增轻量级@tool装饰器,简化 Python 函数注册流程
•Agent 消息支持显示 base64 图片
•Doc Generator 文件元数据可作为独立变量暴露
•Agent chat completion 支持传入chat_template_kwargs
•/chat/completions 接口支持只发送最新消息
•检索阶段向量相似度权重修复
•大量异步、解析器、表格、HTML、日志、文档状态、空响应等问题修复
•Go 侧继续补充大量模型与能力驱动
•安全性增强,包括 SSRF、防止 user_id 伪造、敏感字段泄露修复
•国际化完善,法语翻译补齐大量缺失项
•最低 Python 版本提升到 3.13
下面将严格按照本次发布内容,完整梳理 v0.25.6 的更新要点。
二、新功能:Agent 新增 Browser 组件
本次版本最核心的新功能之一,是Agent 新增 Browser 组件。
这个组件的作用是:
让 AI 能够自主导航并与网页交互。
这意味着 Agent 不再只是被动接收页面内容,而是可以具备更强的网页操作能力,在实际使用中可以执行更多基于浏览器的任务。对于需要网页访问、页面交互、信息获取、在线操作等场景来说,这项能力是非常关键的补强。
从版本说明来看,这一新增功能属于 Agent 能力层面的重要扩展,也是 v0.25.6 最具代表性的新增特性之一。
三、RAG 改进:RAPTOR 构建引入 AHC 模式
在 RAG 方面,本次版本对RAPTOR 构建做了重要升级,引入了AHC 模式(Ψ-RAG)。
1. 语义扩展维度升级
AHC 模式的特点是:
将语义扩展从文档级别提升到了数据集级别。
这意味着构建索引时,系统不仅仅是围绕单篇文档做语义聚合,而是可以在更大范围的数据集合上进行语义建模,从而增强整体的结构表达能力。
2. 构建性能提升
版本说明明确指出:
•索引构建性能显著高于旧 RAPTOR
• 在Recall@5和平均 F1上也优于旧 RAPTOR
也就是说,这次升级不仅是“快”,同时也是“准”。
3. 支持模式切换
用户可以在AHC和GMM模式之间切换。
这说明系统保留了不同构建策略的选择能力,便于根据实际场景做灵活配置。
4. 本版本修复问题
该特性在 v0.25.3 中已引入,本次 v0.25.6 主要是修复了多个相关 Bug,进一步增强稳定性与可用性。
四、Agent 改进:轻量级@tool装饰器
本次版本新增了一个非常实用的 Agent 改进:
轻量级@tool装饰器。
它的目标是简化 Python 函数注册流程,让开发者更方便地把 Python 函数注册给 chat 模型使用。
从开发体验角度看,这种轻量化的装饰器形式,能够减少样板代码,提升工具定义效率。
这是 Agent 工程化体验上的一个明确优化。
五、Agent 改进:消息支持显示 base64 图片
Agent 消息现在支持显示base64 编码图片。
这项改进的意义在于:
• 提高多模态消息展示能力
• 使 Agent 消息不再局限于纯文本
• 在实际交互中可以更自然地携带和展示图片内容
这对于图文混合、截图展示、视觉信息传递等场景非常有帮助。
六、Agent 改进:Doc Generator 文件元数据作为独立变量暴露
本次版本还改进了Doc Generator组件。
现在,Doc Generator 组件的文件元数据可以作为离散变量暴露出来。
这意味着开发者在处理文档生成流程时,可以更精细地访问和使用这些元信息,提升工作流灵活性。
七、Agent 改进:支持传入chat_template_kwargs
Agent chat completion 接口现在支持开发者传入chat_template_kwargs。
这一能力的开放,意味着在构建 chat completion 请求时,可以对模板参数进行更细粒度的控制。
从版本描述来看,这是对 Agent chat completion 接口能力的一次增强。
八、接口修复:/chat/completions 允许只发送最新消息
本次版本修复了一个非常实用的接口问题:
/chat/completions 现在允许请求体中只发送最新消息,不再强制要求传递完整对话历史。
这意味着:
• API 调用更轻量
• 请求体更简洁
• 更适合“只传当前轮输入”的调用方式
• 也更符合实际集成中的常见使用习惯
这一点在版本说明中被单独强调,说明是一个重要的 API 行为修复。
九、检索修复:向量相似度权重在检索阶段未生效
本次版本修复了一个 RAG 检索相关问题:
向量相似度权重在检索阶段没有被正确应用。
这类问题会直接影响检索结果排序和召回质量。
版本修复后,相关权重能够在检索阶段正确生效,使检索行为更符合配置预期。
十、数据集与配置页面修复
本次版本修复了多个管理页面问题:
1. 解析器配置保存失败
修复了数据集配置页面中 parser configs 无法保存的问题。
2. 数据源详情页日志显示不完整
修复了数据源详情页面日志不能完全展示的问题。
3. 文档状态过滤失败
修复了document status filtering failure的问题。
这些都是影响日常运维和配置管理的关键体验问题。
十一、空响应与解析修复
本次版本也修复了一些更底层的健壮性问题:
• 修复了空 LLM choices response时的 crash guard 问题
• 修复了HTML 标签在 ingestion pipeline parser output 中残留的问题
• 修复了table parser metadata问题
• 修复了empty file的提示问题,使错误信息更清晰
这些修复共同提升了 ingestion 和解析链路的稳定性。
十二、RAG RAPTOR 相关修复
除了 AHC 模式升级外,本版本还修复了 RAPTOR 的构建问题:
• 修复了使用 Infinity document engine 时 RAPTOR 构建过程停止的问题
这说明 RAPTOR 相关功能在不同文档引擎下的兼容性得到了进一步修正。
十三、流式响应解析修复
本次版本修复了:
•Mistral / Upstage reasoning models 的流式响应解析问题
这类问题主要影响模型流式输出的稳定解析,修复后有助于提升 reasoning 模型在流式场景中的可用性。
十四、异步与事件循环问题修复
本次版本对 asyncio 相关问题做了集中修复,包括:
• 修复asyncio event loop nesting
• 修复fire-and-forget task问题
• 修复asyncio.Semaphore bound to different event loop错误
• 修复了与 asyncio 正确性相关的问题
这些问题通常出现在高并发、异步任务调度或多事件循环环境中,修复后将显著提升系统稳定性。
十五、Agent 相关 bug 修复
Agent 在本次版本中也有多项修复:
• 修复Agent component prompt variable 消失的问题
• 修复search vector_similarity_weight相关问题
• 修复agent attachment download api的移动问题
• 修复agent 创建与更新 API 中 canvas_type的支持问题
这些都属于 Agent 功能细节上的关键修正。
十六、API 与安全性增强
本次版本在 API 与安全方面也有多项重要修复:
1. session user_id 伪造修复
修复了通过 request body 伪造 session user_id的问题。
2. /dify/retrieval 权限校验
修复了/dify/retrieval 中 kb ownership 校验问题。
3. 敏感字段泄露防护
修复了用户 API 响应中敏感字段泄露的问题。
4. SSRF 防护
修复了misc_utils.download_img 在 OAuth avatars 场景下的 SSRF 风险。
这些改动说明本次版本对安全性进行了明显加固。
十七、文档与工具能力修复
本次版本还修复或增强了文档相关能力:
• 修复/documents/{id}/download相关问题后又进行了回退处理
• 修复解析器输出中的 HTML 标签
• 修复PDF 文档顶部红色高亮替换为黄色
• 修复chunk 标签列表显示
• 提供了chunk management、chat assistant、retrieval 的 SDK 和 cURL 示例
• 修复metadata相关问题
这些更新有助于提升文档处理、展示和接口调用的可用性。
十八、Go 侧能力大规模补齐
本次版本中,Go 相关驱动和模型支持非常丰富,涉及大量 provider、embed、rerank、ASR、TTS、OCR 等能力扩展。下面按内容完整整理。
1. 新增或补充的 provider / driver
• TogetherAI
• n1n.ai
• GPUStack(chat)
• Azure OpenAI 模型驱动
• PPIO provider
• Groq provider
• Tencent Hunyuan provider
• TokenPony provider
• HuaweiCloud model provider
• ModelScope provider
• OrcaRouter provider
• FuturMix provider
• TokenHub provider
• AWS Bedrock provider
2. 新增 embed 能力
• TogetherAI embed
• Xinference embed
• Tencent Hunyuan embed
3. 新增 rerank 能力
• Xinference rerank
• Novita rerank
• DeepInfra rerank
• TogetherAI rerank
4. 新增 ASR / TTS 能力
• Xinference ASR
• Xinference TTS
• TogetherAI ASR
• TogetherAI TTS
• ZhipuAI ASR
• OpenRouter ASR
• Groq reasoning_chat、TTS、ASR
5. 新增 OCR 能力
• ZhipuAI OCR
• Baidu OCR 输入校验
• PaddleOCR_Local provider
• hosted OCR providers 通过 drivers 路由
6. 其他 Go 侧能力
• OpenAI audio endpoints 支持
• Ollama 的 chat、listmodels、embed 重写
• Elasticsearch functions in Go
这些内容说明 Go 生态能力在本版本中持续扩展,覆盖更多模型服务与多模态任务。
十九、Evaluation 与测试增强
本次版本还涉及评估和测试能力增强:
• evaluation 中增加token usage跟踪
• 增加新的restful api suite测试与测试用例
• 改进retry 和 timeout
• 改进CI
这些变化主要提升研发质量、测试覆盖与持续集成稳定性。
二十、国际化与文档更新
本次版本也完成了不少文档和国际化工作:
• 将Python 最低版本要求提升至 3.13
• 更新 README 和文档中的版本引用到 v0.25.6
• 更新 v0.25.5 发布说明
• 完成 Discord 集成指南
• 初稿与草稿形式的 v0.25.6 发布说明同步完善
•法语翻译补齐约 1400 个缺失键
这说明项目在文档、版本维护和语言支持方面也持续推进。
二十一、其他修复与完善
除了前述大项,本次版本还包括以下修复与调整:
• 修复API 路径错误
• 修复任务语言缺失
• 修复模型类型加入 llm_setting
• 修复OpenAI chat completion 与 session_id / conversation_id 关联问题
• 修复文档下载内容类型推断相关问题后回退
• 修复数据源详情日志显示不完整
• 修复表格解析 metadata
• 修复PDF 高亮颜色
• 修复空文件报错信息
• 修复tag list 显示
• 修复parser config 保存问题
• 修复restful api suite 测试
• 修复agent attachment download API
• 修复search vector_similarity_weight
• 修复prompt variable 消失
• 修复canvas_type 支持
• 修复敏感字段泄露
• 修复SSRF
• 修复empty LLM choices
• 修复event loop 相关问题
这些修复覆盖了前后端、API、任务调度、解析链路和安全边界多个层面。
二十二、版本总结
代码地址:github.com/infiniflow/ragflow
总体来看,ragflow v0.25.6 是一次非常全面的版本更新,核心特征可以概括为:
1.Agent 能力增强
• Browser 组件
•@tool装饰器
• base64 图片展示
• 文件元数据独立暴露
•chat_template_kwargs支持
2.RAG 能力升级
• RAPTOR 引入 AHC 模式
• 构建性能和检索指标提升
• 修复 Infinity engine 兼容问题
• 修复向量相似度权重问题
3.API 行为优化
• /chat/completions 允许只传最新消息
• 权限、会话、路径、响应结构等问题修复
4.稳定性全面提升
• async / event loop 修复
• parser / metadata / HTML / table 修复
• 空响应、空文件、流式解析修复
5.安全性增强
• 防 user_id 伪造
• 防敏感字段泄露
• 防 SSRF
• 权限校验加强
6.生态扩展
• 大量 Go provider、embed、rerank、ASR、TTS、OCR 能力补齐
7.工程化完善
• 测试增强
• CI 改进
• 文档更新
• Python 3.13 适配
• 法语翻译补齐
如果从“升级价值”来看,v0.25.6 兼具功能增强、性能优化、问题修复和生态扩张四个维度,属于非常值得关注的一次版本更新。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。