RAG年终总结之12篇综述:从2022到2024看架构、策略、评测及演化
今天是2024年12月13日,星期五,北京,天气晴。
今天,我们继续来看看RAG。
参考了2022-2024三年来的12个RAG综述,共12个综述文章,设计评测…
如何从头建立一个通用AI agent智能体应用?
AI 智能体(也有人称为 AI 代理),英文名称为 AI Agent,更准确地说现在就是指 LLM Agent,它是一个执行逻辑由其底层模型(LLM)控制的程…
大模型应用中大部分人真正需要去关心的核心——Embedding
本文你大概会看到以下内容:
大模型的主要应用场景
主流中文embedding模型
embedding的技术原理
几种语义相似度算法
在生产环境中使用embe…
破茧成蝶 – Serverless Kubernetes 的思考与征程(二)
本文主要针对 Serverless Container 技术的特殊性,分享其对 Kubernetes 的架构影响,以及阿里云在Serverless Kuber…
源码解读 – 微软GraphRAG框架
1.引言
这几天微软开源了一个新的基于知识图谱构建的检索增强生成(RAG)系统, GraphRAG, 该框架旨在利用大型语言模型(LLMs)从非结构化文本中提取…
RAG工程实践拦路虎之一:PDF格式解析杂谈
背景
PDF(Portable Document Format)是一种广泛用于文档交换的文件格式,由Adobe Systems开发。它具有跨平台性、固定布局和易…
7.8K Star RAG 引擎:基于深度文档理解,最大程度降低幻觉、无限上下文快速完成 “大海捞针” 测试!
RAGFlow [1] 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为各种…
万字详解,和你用RAG+LangChain实现chatpdf
像chatgpt这样的大语言模型(LLM)可以回答很多类型的问题,但是,如果只依赖LLM,它只知道训练过的内容,不知道你的私有数据:如公司内部没有联网的企业文档…
【深入浅出RAG】LangChain-RAG优化最终章:RAG结合Agent实现最佳检索结果
书接上文,
【深入浅出RAG】RAG提问重写优化:如何提高问题的准确性
【深入浅出RAG】RAG索引优化:5种方法构建高效索引
…
大模型和向量数据库怎么搭建 RAG 系统?Step by step 例子来了。
RAG 介绍
RAG是一种先进的自然语言处理方法,它结合了信息检索和文本生成技术,用于提高问答系统、聊天机器人等应用的性能。以下是RAG的详细工作流程:
RAG…
一文搞懂大模型RAG应用(附实践案例)
写在前面
大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型就会面临专业知识…
阿里RAG新框架R4:增强检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!
大型语言模型(LLMs)在生成文本时可能会产生错误信息,即“幻觉”问题。尽管检索增强的LLMs通过检索外部数据来减少这种幻觉,但现有的方法通常不考虑检索文档与L…
关于垂类场景下RAG 的思考
写在前面
今天这篇文章不是分享某个技术点也不是分享论文,而是笔者抛砖引玉的提出一些垂类下关于RAG 的瓶颈和一些思考,然后广发英雄帖,感兴趣的读者都可以加入进来…
一文读懂:大模型RAG(检索增强生成)
RAG
检索增强生成(Retrieval Augmented Generation),简称 RAG,已经成为当前最火热的LLM应用方案。
理解不难,就是通过自有…
创业:大模型RAG系统三个月的开发心得和思考
软件工程、Java、Javascript,公众号:八一菜刀
1. 前言
自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,…