ragflow v0.25.6 发布:Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析

网易专栏5小时前发布 nxnqh
1 0 0

🤖 AI总结

主题

ragflow v0.25.6版本发布,涵盖Agent、RAG、API、安全性等多个模块的综合性更新。

摘要

ragflow v0.25.6发布,Agent新增Browser组件,RAG RAPTOR升级至AHC模式,修复多项问题并扩展Go生态,全面提升稳定性与安全性。

关键信息

  • 1 Agent新增Browser组件和@tool装饰器
  • 2 RAG RAPTOR引入AHC模式,性能与召回提升
  • 3 修复大量异步、解析、安全、API问题

ragflow v0.25.6 发布:Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析

ragflow v0.25.6 发布:Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析

ragflow v0.25.6 发布:Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析

一、版本概览

ragflow v0.25.6 于2026年5月26日发布,是一次覆盖Agent、RAG、API、Go 驱动、文档解析、异步调度、权限安全、国际化等多个模块的综合性更新。
从这次发布内容来看,v0.25.6 并不是单点功能补丁,而是一次明显偏向能力补齐、体验增强、问题修复、生态扩展的版本升级。

本次版本最值得关注的方向包括:

Agent 新增 Browser 组件,让 AI 能够自主浏览和操作网页

  • RAG RAPTOR 构建升级到 AHC 模式,语义扩展从文档级别提升到数据集级别

  • Agent 新增轻量级@tool装饰器,简化 Python 函数注册流程

  • Agent 消息支持显示 base64 图片

  • Doc Generator 文件元数据可作为独立变量暴露

  • Agent chat completion 支持传入chat_template_kwargs

  • /chat/completions 接口支持只发送最新消息

  • 检索阶段向量相似度权重修复

  • 大量异步、解析器、表格、HTML、日志、文档状态、空响应等问题修复

  • Go 侧继续补充大量模型与能力驱动

  • 安全性增强,包括 SSRF、防止 user_id 伪造、敏感字段泄露修复

  • 国际化完善,法语翻译补齐大量缺失项

  • 最低 Python 版本提升到 3.13

    下面将严格按照本次发布内容,完整梳理 v0.25.6 的更新要点。

    二、新功能:Agent 新增 Browser 组件

    本次版本最核心的新功能之一,是Agent 新增 Browser 组件

    这个组件的作用是:
    让 AI 能够自主导航并与网页交互

    这意味着 Agent 不再只是被动接收页面内容,而是可以具备更强的网页操作能力,在实际使用中可以执行更多基于浏览器的任务。对于需要网页访问、页面交互、信息获取、在线操作等场景来说,这项能力是非常关键的补强。

    从版本说明来看,这一新增功能属于 Agent 能力层面的重要扩展,也是 v0.25.6 最具代表性的新增特性之一。

    三、RAG 改进:RAPTOR 构建引入 AHC 模式

    在 RAG 方面,本次版本对RAPTOR 构建做了重要升级,引入了AHC 模式(Ψ-RAG)

    1. 语义扩展维度升级

    AHC 模式的特点是:
    将语义扩展从文档级别提升到了数据集级别

    这意味着构建索引时,系统不仅仅是围绕单篇文档做语义聚合,而是可以在更大范围的数据集合上进行语义建模,从而增强整体的结构表达能力。

    2. 构建性能提升

    版本说明明确指出:

    索引构建性能显著高于旧 RAPTOR

  • • 在Recall@5平均 F1上也优于旧 RAPTOR

    也就是说,这次升级不仅是“快”,同时也是“准”。

    3. 支持模式切换

    用户可以在AHCGMM模式之间切换。
    这说明系统保留了不同构建策略的选择能力,便于根据实际场景做灵活配置。

    4. 本版本修复问题

    该特性在 v0.25.3 中已引入,本次 v0.25.6 主要是修复了多个相关 Bug,进一步增强稳定性与可用性。

    四、Agent 改进:轻量级@tool装饰器

    本次版本新增了一个非常实用的 Agent 改进:
    轻量级@tool装饰器

    它的目标是简化 Python 函数注册流程,让开发者更方便地把 Python 函数注册给 chat 模型使用。
    从开发体验角度看,这种轻量化的装饰器形式,能够减少样板代码,提升工具定义效率。

    这是 Agent 工程化体验上的一个明确优化。

    五、Agent 改进:消息支持显示 base64 图片

    Agent 消息现在支持显示base64 编码图片

    这项改进的意义在于:

    • 提高多模态消息展示能力

  • • 使 Agent 消息不再局限于纯文本

  • • 在实际交互中可以更自然地携带和展示图片内容

    这对于图文混合、截图展示、视觉信息传递等场景非常有帮助。

    六、Agent 改进:Doc Generator 文件元数据作为独立变量暴露

    本次版本还改进了Doc Generator组件。

    现在,Doc Generator 组件的文件元数据可以作为离散变量暴露出来。
    这意味着开发者在处理文档生成流程时,可以更精细地访问和使用这些元信息,提升工作流灵活性。

    七、Agent 改进:支持传入chat_template_kwargs

    Agent chat completion 接口现在支持开发者传入chat_template_kwargs

    这一能力的开放,意味着在构建 chat completion 请求时,可以对模板参数进行更细粒度的控制。
    从版本描述来看,这是对 Agent chat completion 接口能力的一次增强。

    八、接口修复:/chat/completions 允许只发送最新消息

    本次版本修复了一个非常实用的接口问题:
    /chat/completions 现在允许请求体中只发送最新消息,不再强制要求传递完整对话历史。

    这意味着:

    • API 调用更轻量

  • • 请求体更简洁

  • • 更适合“只传当前轮输入”的调用方式

  • • 也更符合实际集成中的常见使用习惯

    这一点在版本说明中被单独强调,说明是一个重要的 API 行为修复。

    九、检索修复:向量相似度权重在检索阶段未生效

    本次版本修复了一个 RAG 检索相关问题:
    向量相似度权重在检索阶段没有被正确应用。

    这类问题会直接影响检索结果排序和召回质量。
    版本修复后,相关权重能够在检索阶段正确生效,使检索行为更符合配置预期。

    十、数据集与配置页面修复

    本次版本修复了多个管理页面问题:

    1. 解析器配置保存失败

    修复了数据集配置页面中 parser configs 无法保存的问题。

    2. 数据源详情页日志显示不完整

    修复了数据源详情页面日志不能完全展示的问题。

    3. 文档状态过滤失败

    修复了document status filtering failure的问题。

    这些都是影响日常运维和配置管理的关键体验问题。

    十一、空响应与解析修复

    本次版本也修复了一些更底层的健壮性问题:

    • 修复了空 LLM choices response时的 crash guard 问题

  • • 修复了HTML 标签在 ingestion pipeline parser output 中残留的问题

  • • 修复了table parser metadata问题

  • • 修复了empty file的提示问题,使错误信息更清晰

    这些修复共同提升了 ingestion 和解析链路的稳定性。

    十二、RAG RAPTOR 相关修复

    除了 AHC 模式升级外,本版本还修复了 RAPTOR 的构建问题:

    • 修复了使用 Infinity document engine 时 RAPTOR 构建过程停止的问题

    这说明 RAPTOR 相关功能在不同文档引擎下的兼容性得到了进一步修正。

    十三、流式响应解析修复

    本次版本修复了:

    Mistral / Upstage reasoning models 的流式响应解析问题

    这类问题主要影响模型流式输出的稳定解析,修复后有助于提升 reasoning 模型在流式场景中的可用性。

    十四、异步与事件循环问题修复

    本次版本对 asyncio 相关问题做了集中修复,包括:

    • 修复asyncio event loop nesting

  • • 修复fire-and-forget task问题

  • • 修复asyncio.Semaphore bound to different event loop错误

  • • 修复了与 asyncio 正确性相关的问题

    这些问题通常出现在高并发、异步任务调度或多事件循环环境中,修复后将显著提升系统稳定性。

    十五、Agent 相关 bug 修复

    Agent 在本次版本中也有多项修复:

    • 修复Agent component prompt variable 消失的问题

  • • 修复search vector_similarity_weight相关问题

  • • 修复agent attachment download api的移动问题

  • • 修复agent 创建与更新 API 中 canvas_type的支持问题

    这些都属于 Agent 功能细节上的关键修正。

    十六、API 与安全性增强

    本次版本在 API 与安全方面也有多项重要修复:

    1. session user_id 伪造修复

    修复了通过 request body 伪造 session user_id的问题。

    2. /dify/retrieval 权限校验

    修复了/dify/retrieval 中 kb ownership 校验问题。

    3. 敏感字段泄露防护

    修复了用户 API 响应中敏感字段泄露的问题。

    4. SSRF 防护

    修复了misc_utils.download_img 在 OAuth avatars 场景下的 SSRF 风险

    这些改动说明本次版本对安全性进行了明显加固。

    十七、文档与工具能力修复

    本次版本还修复或增强了文档相关能力:

    • 修复/documents/{id}/download相关问题后又进行了回退处理

  • • 修复解析器输出中的 HTML 标签

  • • 修复PDF 文档顶部红色高亮替换为黄色

  • • 修复chunk 标签列表显示

  • • 提供了chunk management、chat assistant、retrieval 的 SDK 和 cURL 示例

  • • 修复metadata相关问题

    这些更新有助于提升文档处理、展示和接口调用的可用性。

    十八、Go 侧能力大规模补齐

    本次版本中,Go 相关驱动和模型支持非常丰富,涉及大量 provider、embed、rerank、ASR、TTS、OCR 等能力扩展。下面按内容完整整理。

    1. 新增或补充的 provider / driver

    • TogetherAI

  • • n1n.ai

  • • GPUStack(chat)

  • • Azure OpenAI 模型驱动

  • • PPIO provider

  • • Groq provider

  • • Tencent Hunyuan provider

  • • TokenPony provider

  • • HuaweiCloud model provider

  • • ModelScope provider

  • • OrcaRouter provider

  • • FuturMix provider

  • • TokenHub provider

  • • AWS Bedrock provider

    2. 新增 embed 能力

    • TogetherAI embed

  • • Xinference embed

  • • Tencent Hunyuan embed

    3. 新增 rerank 能力

    • Xinference rerank

  • • Novita rerank

  • • DeepInfra rerank

  • • TogetherAI rerank

    4. 新增 ASR / TTS 能力

    • Xinference ASR

  • • Xinference TTS

  • • TogetherAI ASR

  • • TogetherAI TTS

  • • ZhipuAI ASR

  • • OpenRouter ASR

  • • Groq reasoning_chat、TTS、ASR

    5. 新增 OCR 能力

    • ZhipuAI OCR

  • • Baidu OCR 输入校验

  • • PaddleOCR_Local provider

  • • hosted OCR providers 通过 drivers 路由

    6. 其他 Go 侧能力

    • OpenAI audio endpoints 支持

  • • Ollama 的 chat、listmodels、embed 重写

  • • Elasticsearch functions in Go

    这些内容说明 Go 生态能力在本版本中持续扩展,覆盖更多模型服务与多模态任务。

    十九、Evaluation 与测试增强

    本次版本还涉及评估和测试能力增强:

    • evaluation 中增加token usage跟踪

  • • 增加新的restful api suite测试与测试用例

  • • 改进retry 和 timeout

  • • 改进CI

    这些变化主要提升研发质量、测试覆盖与持续集成稳定性。

    二十、国际化与文档更新

    本次版本也完成了不少文档和国际化工作:

    • 将Python 最低版本要求提升至 3.13

  • • 更新 README 和文档中的版本引用到 v0.25.6

  • • 更新 v0.25.5 发布说明

  • • 完成 Discord 集成指南

  • • 初稿与草稿形式的 v0.25.6 发布说明同步完善

  • 法语翻译补齐约 1400 个缺失键

    这说明项目在文档、版本维护和语言支持方面也持续推进。

    二十一、其他修复与完善

    除了前述大项,本次版本还包括以下修复与调整:

    • 修复API 路径错误

  • • 修复任务语言缺失

  • • 修复模型类型加入 llm_setting

  • • 修复OpenAI chat completion 与 session_id / conversation_id 关联问题

  • • 修复文档下载内容类型推断相关问题后回退

  • • 修复数据源详情日志显示不完整

  • • 修复表格解析 metadata

  • • 修复PDF 高亮颜色

  • • 修复空文件报错信息

  • • 修复tag list 显示

  • • 修复parser config 保存问题

  • • 修复restful api suite 测试

  • • 修复agent attachment download API

  • • 修复search vector_similarity_weight

  • • 修复prompt variable 消失

  • • 修复canvas_type 支持

  • • 修复敏感字段泄露

  • • 修复SSRF

  • • 修复empty LLM choices

  • • 修复event loop 相关问题

    这些修复覆盖了前后端、API、任务调度、解析链路和安全边界多个层面。

    二十二、版本总结

    代码地址:github.com/infiniflow/ragflow

    总体来看,ragflow v0.25.6 是一次非常全面的版本更新,核心特征可以概括为:

    1.Agent 能力增强

    • Browser 组件

  • @tool装饰器

  • • base64 图片展示

  • • 文件元数据独立暴露

  • chat_template_kwargs支持

    2.RAG 能力升级

    • RAPTOR 引入 AHC 模式

  • • 构建性能和检索指标提升

  • • 修复 Infinity engine 兼容问题

  • • 修复向量相似度权重问题

    3.API 行为优化

    • /chat/completions 允许只传最新消息

  • • 权限、会话、路径、响应结构等问题修复

    4.稳定性全面提升

    • async / event loop 修复

  • • parser / metadata / HTML / table 修复

  • • 空响应、空文件、流式解析修复

    5.安全性增强

    • 防 user_id 伪造

  • • 防敏感字段泄露

  • • 防 SSRF

  • • 权限校验加强

    6.生态扩展

    • 大量 Go provider、embed、rerank、ASR、TTS、OCR 能力补齐

    7.工程化完善

    • 测试增强

  • • CI 改进

  • • 文档更新

  • • Python 3.13 适配

  • • 法语翻译补齐

    如果从“升级价值”来看,v0.25.6 兼具功能增强、性能优化、问题修复和生态扩张四个维度,属于非常值得关注的一次版本更新。

    我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

    © 版权声明

    相关文章