
RAG工程实践拦路虎之一:PDF格式解析杂谈
背景
PDF(Portable Document Format)是一种广泛用于文档交换的文件格式,由Adobe Systems开发。它具有跨平台性、固定布局和易…

7.8K Star RAG 引擎:基于深度文档理解,最大程度降低幻觉、无限上下文快速完成 “大海捞针” 测试!
RAGFlow [1] 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为各种…

万字详解,和你用RAG+LangChain实现chatpdf
像chatgpt这样的大语言模型(LLM)可以回答很多类型的问题,但是,如果只依赖LLM,它只知道训练过的内容,不知道你的私有数据:如公司内部没有联网的企业文档…

被问懵了,加密后的数据如何进行模糊查询?
加密后的数据对模糊查询不是很友好,本篇就针对加密数据模糊查询这个问题来展开讲一讲实现的思路。
为了数据安全我们在开发过程中经常会对重要的数据进行加密存储,常见的…

九、Stable Diffusion – ControlNet 控制模型安装与使用
(slot:series,id=sd&type=post)
基于扩散模型的AI绘画非常难以控制,出图充满了随机性,缺乏稳定输出能力。
ControlNe…

万字长文解析 GPT-4o 背后的技术原理
图片由 DALL·E 3 生成
提示词为:A futuristic illustration of a high-tech planet named GPT-…

【深入浅出RAG】LangChain-RAG优化最终章:RAG结合Agent实现最佳检索结果
书接上文,
【深入浅出RAG】RAG提问重写优化:如何提高问题的准确性
【深入浅出RAG】RAG索引优化:5种方法构建高效索引
…

共识Raft:如何保证多机房数据的一致性?
当机房 A 修改了一条数据的同时,机房 B 也对该数据进行了更新,Otter 会通过合并逻辑来处理冲突的数据行或字段,以达到合并效果。为了避免这种冲突,我们在上…

缓存一致:读多写少时,如何解决数据更新缓存不同步?
我们之前提到过,互联网大多数业务场景的数据都属于读多写少,在请求的读写比例中,写的比例会达到百分之一,甚至千分之一。而对于用户中心的业务来说,这个比例会更大一些…

实时统计:链路跟踪实时计算中的实用算法
如果数据量庞大,那么需要投入的服务器资源就会更多。就拿我们之前经历过的最大规模来说,曾投入了大约 2000 台服务器来搭建 ELK。然而,如果服务器资源十分匮乏…

9700字干货!超全面的Stable Diffusion学习指南:文生图篇
一、关于文生图
在 Stable Diffusion 中,有文生图和图生图 2 种绘图模式,今天我们先来看看如何使用文生图来绘制我们想要的图片。下面是 Stab…

一、Stable Diffusion – Windows系统本地按安装部署
(slot:series,id=sd&type=post)
一、前置软件安装
1、Python
目前官方推荐安装 Python 3.10.6版本。
P…

二、Stable Diffusion – 不同画风模型下载与安装
(slot:series,id=sd&type=post)
一、模型简介
存盘点模型(checkpoint)是AI生图的重要依据。Stable Dif…

三、Stable Diffusion WebUI – 扩展插件的安装与应用
(slot:series,id=sd&type=post)
一、插件的安装
1、方式1:通过内置列表查询安装
此种方式实测有问题,获取不了插件列表,…

五、Stable Diffusion – 如何图生图(使用图片生成图片)
(slot:series,id=sd&type=post)
一、什么是图生图
图生图:即给AI输入参考图片,让AI参考样图生成图片。
二、如何操作图生…