ControlNet详细入门介绍

写在前面
一直知道ControlNet是个大利器,但是WEB UI上的那么多参数,看着特别吓人。在网上各种查资料,但是那些要么不是太全,要么就说得比较模糊,实操…

让天下没有难Tuning的大模型-PEFT技术简介

最近,深度学习的研究中出现了许多大型预训练模型,例如GPT-3、BERT等,这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中,ChatGPT模型因…

如何最简单、通俗地理解Transformer?

 
这个东西很难说到底有没有一种简单、通俗地理解方式。
你看这个问题下面现在有60多个回答,我大概翻看了一下,几乎都是长篇大论,原因很简单…

LoRA遇上MoE,大模型再也不会健忘了

最近组里同学在尝试实现LoRAMoE,意在解决大模型微调后遗忘世界知识的问题。参考的是复旦23年年底的这篇论文:"LoRAMoE: Revolutio…

程序员系统入门大模型的路径和资源,看这篇就够了

本篇文章面向对大模型领域感兴趣,又不知如何下嘴的程序员。
看一下围绕大模型的应用场景和人才需求:

Prompt工程:
基于提示词对大模型的使用,会问问题就行。…

关于垂类场景下RAG 的思考

写在前面
今天这篇文章不是分享某个技术点也不是分享论文,而是笔者抛砖引玉的提出一些垂类下关于RAG 的瓶颈和一些思考,然后广发英雄帖,感兴趣的读者都可以加入进来…

大模型和向量数据库怎么搭建 RAG 系统?Step by step 例子来了。

RAG 介绍
RAG是一种先进的自然语言处理方法,它结合了信息检索和文本生成技术,用于提高问答系统、聊天机器人等应用的性能。以下是RAG的详细…

一文读懂:大模型RAG(检索增强生成)

RAG
检索增强生成(Retrieval Augmented Generation),简称 RAG,已经成为当前最火热的LLM应用方案。
理解不难,就是通过自有…

一文搞懂大模型RAG应用(附实践案例)

写在前面

大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型就会面临专业知识…

创业:大模型RAG系统三个月的开发心得和思考

软件工程、Java、Javascript,公众号:八一菜刀
1. 前言

自从和员外上家公司离职后,我们就自己搞公司投入到了RAG大模型的AI产品应用的开发中,…

主打一个不花钱:国产大模型逆向API白嫖

仅限自用,禁止对外提供服务或商用,避免对官方造成服务压力,否则风险自担!
如今的优秀国产大模型在日常使用中完全可以独当一面。
而且都提供了基础的免费网页服务,但…

RAG+大模型在电商客服领域-商品推荐的应用

本文是我们项目小组的技术负责人 史蒂夫-彭 贡献的~重点在介绍基于大模型做商品推荐,这个一直是难点,我们到现在还在持续优化方案~

近年来,随着大型…

RAG和微调哪个是LLM优化的最优解

RAG和微调哪个是LLM优化的最优解

序言
随着对大型语言模型(llm)的兴起,许多开发人员和组织都在忙着利用它的能力构建自己的应用程序。然而,当预训练的大语…

AI大模型应用随笔-RAG工作流应用搭建

AI大模型应用随笔-RAG工作流应用搭建
概要
RAG数据增强是我们解决大模型场景知识的缺失或回答不准确,还有最重要且常见的大模型回答幻觉问题的很有用的解决方法…

淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA

( 本文阅读时间:5分钟 )
9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA,旨在让技术开发者们能够更方便地提升大…

大模型应用的 10 种架构模式

作者 | 曹洪伟
在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程…

淘天集团大模型应用十大挑战命题发布

( 本文阅读时间:15分钟 )
以AI人工智能为代表的新技术正在成为全球商业发展的新动能。淘天集团从去年开始,就已经在AI重点领域,展开和高校的一系列深入合作…

一文掌握大模型提示词技巧:从战略到战术

阿里妹导读
本文将用通俗易懂的语言,带你从战略(宏观)和战术(微观)两个层次掌握大模型提示词的常见技巧,真正做到理论和实践相结合,占领 AI 运用的先机。
一…

大模型推理优化实践:KV cache复用与投机采样

阿里妹导读
在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架…

Hugging Face 超详细介绍和使用教程

文章目录

一、前言
二、可以获得什么?
三、入门实践

3.1 帮助文档
3.2 安装
3.3 模型的组成
3.4 BERT模型的使用

3.4.1 导入…