如何最简单、通俗地理解Transformer?

 
这个东西很难说到底有没有一种简单、通俗地理解方式。
你看这个问题下面现在有60多个回答,我大概翻看了一下,几乎都是长篇大论,原因很简单…

RAG+大模型在电商客服领域-商品推荐的应用

本文是我们项目小组的技术负责人 史蒂夫-彭 贡献的~重点在介绍基于大模型做商品推荐,这个一直是难点,我们到现在还在持续优化方案~

近年来,随着大型…

提示词:怎样与大模型沟通

同前面讲大模型特点类似,关于如何使用 GPT,我们也会分成两个视角:用户视角和技术视角。这一讲,我们先从用户视角来看看如何用好 GPT。
用好 GPT
若要充分…

用户视角:你应该知道的LLM基础知识

我们都知道,这一波的 AI 浪潮始于 2022 年底的 ChatGPT 发布,有一幅图,很多人都见过,它说明 ChatGPT 是人类有始以来最快突破一亿用户的应…

技术视角:你应该知道的LLM基础知识

技术视角的大模型
从技术角度来看大模型,关键就在于弄明白一件事,那就是大模型究竟做了什么。实际上,大模型的工作原理并不复杂,简单来讲,就是每次添加一个词。那该如…

一文搞懂大模型RAG应用(附实践案例)

写在前面

大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型就会面临专业知识…

大模型微调总结

最近,深度学习的研究中出现了许多大型预训练模型,例如 GPT-3、ChatGPT、GPT4、ChatGLM-130B 等,这些模型可以在多种自然语言处理任务中取…

大模型的研究新方向:混合专家模型(MoE)

大模型的发展已经到了一个瓶颈期,包括被业内所诟病的罔顾事实而产生的“幻觉”问题、深层次的逻辑理解能力、数学推理能力等,想要解决这些问题就不得不继续增…

什么是LoRA模型,如何使用和训练LoRA模型?你想要的都在这!

什么是LoRA模型
LoRA的全称是LoRA: Low-Rank Adaptation of Large Language Models,可以理解…

大模型应用于数字人

大模型会改变整个软件行业, 其中具有代表性的产品之一是数字人, 那么,什么是数字人呢?数字人涉及了哪些关键技术呢?大模型对数字人的发展带来哪些影响呢?

Hugging Face 超详细介绍和使用教程

文章目录

一、前言
二、可以获得什么?
三、入门实践

3.1 帮助文档
3.2 安装
3.3 模型的组成
3.4 BERT模型的使用

3.4.1 导入…

让天下没有难Tuning的大模型-PEFT技术简介

最近,深度学习的研究中出现了许多大型预训练模型,例如GPT-3、BERT等,这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中,ChatGPT模型因…

LoRA遇上MoE,大模型再也不会健忘了

最近组里同学在尝试实现LoRAMoE,意在解决大模型微调后遗忘世界知识的问题。参考的是复旦23年年底的这篇论文:"LoRAMoE: Revolutio…

程序员系统入门大模型的路径和资源,看这篇就够了

本篇文章面向对大模型领域感兴趣,又不知如何下嘴的程序员。
看一下围绕大模型的应用场景和人才需求:

Prompt工程:
基于提示词对大模型的使用,会问问题就行。…

关于垂类场景下RAG 的思考

写在前面
今天这篇文章不是分享某个技术点也不是分享论文,而是笔者抛砖引玉的提出一些垂类下关于RAG 的瓶颈和一些思考,然后广发英雄帖,感兴趣的读者都可以加入进来…

一文读懂:大模型RAG(检索增强生成)

RAG
检索增强生成(Retrieval Augmented Generation),简称 RAG,已经成为当前最火热的LLM应用方案。
理解不难,就是通过自有…

创业:大模型RAG系统三个月的开发心得和思考

软件工程、Java、Javascript,公众号:八一菜刀
1. 前言

自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,…

主打一个不花钱:国产大模型逆向API白嫖

仅限自用,禁止对外提供服务或商用,避免对官方造成服务压力,否则风险自担!
如今的优秀国产大模型在日常使用中完全可以独当一面。
而且都提供了基础的免费网页服务,但…

RAG和微调哪个是LLM优化的最优解

RAG和微调哪个是LLM优化的最优解

序言
随着对大型语言模型(llm)的兴起,许多开发人员和组织都在忙着利用它的能力构建自己的应用程序。然而,当预训练的大语…

AI大模型应用随笔-RAG工作流应用搭建

AI大模型应用随笔-RAG工作流应用搭建
概要
RAG数据增强是我们解决大模型场景知识的缺失或回答不准确,还有最重要且常见的大模型回答幻觉问题的很有用的解决方法…