pc28官网
你的位置:pc28官网 > 加拿大pc28预测在线预测大神吧 >
UltraRAG团队 投稿量子位 | 公众号 QbitAI加拿大pc28开奖
RAG系统的搭建与优化是一项雄壮且复杂的系统工程,常常需要兼顾测试制定、检索调优、模子调优等关节才略,繁琐的责任进程经常让东谈主无从下手。
近日,针对以上痛点,清华大学THUNLP团队衔接东北大学NEUIR、面壁智能及9#AISoft团队共同推出了UltraRAG框架,该框架修订了传统RAG系统的缔造与竖立方法,极大镌汰了学习本钱和缔造周期。
UltraRAG 不仅具备自尊专科用户需求的“单反相机”级致密化竖立才调,同期也提供访佛“卡片机”的一键式能够操作,让RAG系统的构建变得极简且高效。

更迫切的是,比拟复杂竖立的Llamaindex等传统RAG框架,UltraRAG愈加照顾将模子适配到用户提供的,灵验幸免在“模子选型”的反复纠结。
同期,其模块化想象又能为科研需求快速赋能,匡助商量者在多种场景下解放组合、快速迭代。通过UltraRAG,用户不错简短完成从数据到模子的全进程惩处。
一同发布的还有一系列 RAG 技艺全家桶,其中,RAG-DDR、VisRAG 刚刚被ICLR收录,MiniCPM-Embedding已有30余万次下载量。
GitHub地址可到文末领取。
零代码编程WebUI支撑,一键式系统化数据构建
UltraRAG以其极简的WebUI看成中枢上风之一,即即是无编程教养的用户,也能简短完成模子的构建、测验与评测。
不管是快速开展本质,仍是进行个性化定制,UltraRAG均能提供直不雅且高效的支撑。该框架集成了多种预设责任流,用户可凭证具体需求纯真礼聘最优旅途,无需编写繁琐代码,即可完成从数据处理到模子优化的全进程操作。
以下是操作演示:
UltraRAG以自研的KBAlign、DDR等挨次为中枢,提供“一键式”数据构建,勾通检索与生成模子的千般化微调战略,助力性能全面优化。
在数据构造方面,UltraRAG隐匿从检索模子到生成模子的全进程数据构建有辩论,支撑基于用户导入的学问库自动生成测验数据,显耀晋升场景问答的效能与适配效能。
在模子微调方面,UltraRAG提供了完备的测验剧本,支撑Embedding模子测验及LLM的DPO/SFT微调,匡助用户基于数据构建更强劲、更精确的模子。

UltraRAG以自研的UltraRAG-Eval挨次为中枢,会通针对灵验与关节信息的多阶段评估战略,显耀晋升模子评估的正经性,隐匿从检索模子到生成模子的多维评估主见,支撑从举座到各才略的全面评估,确保模子各项性能主见在本色期骗中获得充分考证。
通过关节信息点锚定,UltraRAG灵验增强评估的褂讪性与可靠性,同期提供精确反映,助力缔造者握续优化模子与挨次,进一步晋升系统的正经性与实用性。
下半场初,费尔南德斯领到第二张黄牌,这意味着他在对主队后卫内尔森·塞梅多犯规后被红牌罚下。

UltraRAG内置THUNLP-RAG组自研挨次十分他前沿RAG技艺,支撑通盘这个词模块化的握续探索与研发。UltraRAG不仅是一个技艺框架,更是科研东谈主员与缔造者的给力助手,助力用户在多种任务场景中高效寻优。

UltraRAG内置探索技艺系列
UltraRAG系列引入多项改变技艺,优化了检索增强生成中的学问适配、任务稳健和数据处理,晋升了系统的智能性和高效性。
UltraRAG-KBAlign:晋升谎言语模子自适须学问库的才调,优化学问检索与推理过程。2.4B模子通过自标注达到GPT-4o的标注性能,并在多个本质中超过GPT-4o自身。UltraRAG-Embedding:出色的中英文检索才调,支撑长文本与寥落检索,通行评测榜单MTEB-Retrieval上性能评分朝上 BGE-M3 10%。UltraRAG-Vis:建议了纯视觉的RAG Pipeline,通过引入VLMs对文档进行编码,幸免了文档贯通形成的信息丢失,比拟传统Text RAG Pipeline,部分任务在端到端性能上晋升25-39%。UltraRAG-Adaptive-Note:通过动态挂念惩处和信息网罗,晋升复杂问答任务中的解答质料。在GPT-3.5-turbo、Llama3-8B、Qwen2-7B等多个前沿模子上本质标明,自稳健地动态挂念惩处和信息网罗战略相较基础检索增强生成模子齐备3%~13.9%的性能晋升,况兼尤其擅所长理具有复杂信息检索需求的问题。UltraRAG-DDR:基于可微调数据奖励(DDR)优化检索增强生成,晋升任务特定场景的系统性能。在MiniCPM-2.4B、Llama3-8B等多个前沿模子上本质标明,DDR优化战略相较原始检索增强生成模子可齐备7%以上性能晋升。UltraRAG-Eval:针对RAG场景想象的高效评测有辩论。通过极少种子文档,快速自动生成专科限制的RAG评测数据,并提供正经的模子运转评测主见与挨次。
UUltraRAG各挨次在国表里AI社区中享有一定的影响力和有名度,部分模子领有30余万次下载量。

Github地址:https://github.com/OpenBMB/UltraRAG
参考文件
https://arxiv.org/abs/2410.13509
Li, Xinze, Mei, Sen, Liu, Zhenghao, Yan, Yukun, Wang, Shuo, Yu, Shi, Zeng, Zheni, Chen, Hao, Yu, Ge, Liu, Zhiyuan, et al. (2024). RAG-DDR: Optimizing Retrieval-Augmented Generation Using Differentiable Data Rewards. arXiv preprint arXiv:2410.13509.【ICLR 2025】
https://arxiv.org/abs/2410.10594
Yu, Shi, Tang, Chaoyue, Xu, Bokai, Cui, Junbo, Ran, Junhao, Yan, Yukun, Liu, Zhenghao, Wang, Shuo, Han, Xu, Liu, Zhiyuan, et al. (2024). Visrag: Vision-based Retrieval-Augmented Generation on Multi-Modality Documents. arXiv preprint arXiv:2410.10594. 【ICLR 2025】
https://arxiv.org/abs/2410.08821
Wang, Ruobing, Zha, Daren, Yu, Shi, Zhao, Qingfei, Chen, Yuxuan, Wang, Yixuan, Wang, Shuo, Yan, Yukun, Liu, Zhenghao, Han, Xu, et al. (2024). Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation. arXiv preprint arXiv:2410.08821.
https://arxiv.org/abs/2411.14790
Zeng, Zheni, Chen, Yuxuan, Yu, Shi, Yan, Yukun, Liu, Zhenghao, Wang, Shuo, Han, Xu, Liu, Zhiyuan, Sun, Maosong. (2024). KBAlign: Efficient Self Adaptation on Specific Knowledge Bases. arXiv preprint arXiv:2411.14790.
https://arxiv.org/abs/2408.01262
Zhu, K., Luo, Y., Xu, D., Wang, R., Yu, S., Wang, S., Yan, Y., Liu, Z., Han, X., Liu, Z., & others. (2024). Rageval: Scenario specific rag evaluation dataset generation framework. arXiv preprint arXiv:2408.01262.