漫谈DeepSeek及其背后的核心技术

阿里妹导读

 
本文深入探讨了DeepSeek大模型的核心技术,从公司背景、模型能力、训推成本到核心技术细节进行了全面分析。
&nb…

AI编程零基础?Cursor从0到1的万字保姆级详解

第一章:打破编程的神话与误区
传统编程的刻板印象
编程不是高不可攀的技术
编程,曾经被神秘化,就像一个只有天才才能掌握的黑暗艺术。

但现实是,编程和做饭、学开…

RAG年终总结之12篇综述:从2022到2024看架构、策略、评测及演化

今天是2024年12月13日,星期五,北京,天气晴。
今天,我们继续来看看RAG。
参考了2022-2024三年来的12个RAG综述,共12个综述文章,设计评测…

RAG与本地知识库,向量数据库,以及知识图谱的联系与区别


RAG的本质是高效检索,而知识库,向量数据库和知识图谱只是组织数据的一种形式”
这两天在之前的一篇关于RAG检索增强的文章中有一个评论,问RAG和知识图谱的…

2个简单技巧把 RAG 检索准确率从 50% 提高到 95 %

在讨论了 RAG 的 chunking、embedding、评估指标、评估流程等技术后,我们进一步探讨 RAG 系统的实际应用。在实际项目中,RAG(Retri…

漫画 Transform: 手把手用数学公式推导

我学习的时候总有个执念:这个背后的底层原理是什么?
这个执念经常会让我在理解新的知识的时候,造成很大的障碍。如果我不能理解它的底层原理,我就很难去理解在它基础上…

ControlNet详细入门介绍

写在前面
一直知道ControlNet是个大利器,但是WEB UI上的那么多参数,看着特别吓人。在网上各种查资料,但是那些要么不是太全,要么就说得比较模糊,实操…

Transformer动画讲解 – 多模态

(slot:series,id=transformer)

Transformer多模态
Transformer模型是一种基于自注意力机制的神经网络架构,…

神经网络算法 – 一文搞懂GPT(Generative Pre-trained Transformer)

(slot:series,id=transformer)
本文将从GPT的本质、GPT的原理、GPT架构改进三个方面,带您一文搞懂Generative Pre…

Transformer动画讲解 – 工作原理

(slot:series,id=transformer)
Transformer工作原理
一、 GPT的核心是Transformer
GPT :GPT(Gene…

Ubuntu22.04 安装 stable-diffusion-webui

一、前言
在将日程上的NVIDIA驱动以及CUDA、cuDNN安装完毕后,接下来终于可以安装 stable-diffusion-webui,进行我的跑图实验了,…

Ubuntu22.04 安装CUDA 和cuDNN(答惑版)

一、前言
在我的上一篇文章《Ubuntu22.04 安装NVIDIA驱动》中提过,我自己装了一台电脑,并想用它跑一些AI相关的项目,比如stable-diffu…

Ubuntu22.04 安装NVIDIA驱动(吐血版)

一、前言
前段时间装了一个主机,准备用来跑图,显卡是英伟达 4060Ti 16G,以下是安装显卡驱动的一些经验(由于我是第一次安装,所以一些卸载旧驱动的操作我是…

深度解读AI大模型的向量数据库(中)

(slot:series,id=vector-db&type=post)
一、前言
在生成式AI时代(更确切地说,自从 ChatGPT 发布以来),你至…

1000条Stable Diffusion提示词一篇汇总

一、基础服装提示词

二、人物动作姿势提示词

三、AI女性发型提示词

四、男生发型提示词

五、实用镜头视角构图提示词

六、人物表情控…

Stable diffusion小白入门第1课:软件安装及介绍

(slot:series, id=sd-newbie2&type=post)
大家好,这里是《Stable diffusion小白入门》系列的第1篇,主…

源码解读 – 微软GraphRAG框架

1.引言
这几天微软开源了一个新的基于知识图谱构建的检索增强生成(RAG)系统, GraphRAG, 该框架旨在利用大型语言模型(LLMs)从非结构化文本中提取…

人工智能 AI RAG 工程实现全流程

RAG
1.1
RAG概述

RAG是为了解决LLMs在实际应用中面临的问题(如幻觉、知识更新缓慢和答案缺乏透明度等)所衍生出的一种解决方案。主要通过从外…

RAG工程实践拦路虎之一:PDF格式解析杂谈

背景
PDF(Portable Document Format)是一种广泛用于文档交换的文件格式,由Adobe Systems开发。它具有跨平台性、固定布局和易…

混合专家模型 (MoE) 详解

随着 Mixtral 8x7B (announcement, model card) 的推出,一种称为混合专家模型 (Mixed Expert Models,简…