人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

1.SFT 监督微调
1.1 SFT 监督微调基本概念
SFT(Supervised Fine-Tuning)监督微调是指在源数据集上预训练一个神经网络模型,即…

选微调、RAG还是微调+RAG?

一、RAG (Retrieval Augmented Generation)
RAG技术是一种结合了检索与生成的方法。它通常依赖于两个核心组件:一个大型语言模型…

Tailwind CSS – 无需离开HTML即可快速构建美观的网站

引言
在Web开发领域,CSS框架是提高开发效率和维护性的关键工具之一。Tailwind CSS 是一个备受欢迎的、基于原子类的CSS框架,它以独特的方式重新定…

深入浅出LangChain与智能Agent:构建下一代AI助手

阿里妹导读
LangChain为大型语言模型提供了一种全新的搭建和集成方式,通过这个强大的框架,我们可以将复杂的技术任务简化,让创意和创新更加易于实现。本文从…

从零构建现代深度学习框架(TinyDL-0.01)

阿里妹导读
本文主要以一个Java工程师视角,阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架(类比AI的操作系统)。
本文主…

技术人必修课:利用金字塔原理高效思考与表达

阿里妹导读
作者写这篇文章的目的就是希望能够帮助更多同学了解金字塔原理并合理应用,不只是写作,更是要着眼于思考和表达。本文将围绕认识金字塔结构、表达的逻辑、思…

上帝的巴别塔在崩塌?阿里翻译一年2500亿次调用,节省25亿美元

神经网络机器翻译(Neural Machine Translation, NMT)模型自2013年在学术界首次被提出后,就不断快速发展,目前在某些语种和场景下,…

中国首个量子计算机诞生 中科院、阿里巴巴共同研发

5月3日,科技界迎来了一个振奋人心的消息:世界上第一台超越早期经典计算机的光量子计算机在中国诞生!这标志着我国的量子计算机研究领域已迈入世界一流水平行列。据悉,…

『干货』阿里研究员徐盈辉:在线AI技术在搜索与推荐场景的应用

近日,美国权威杂志《麻省理工科技评论》(MIT Technology Review)发布了2017全球十大突破性技术榜单,强化学习(Reinforcement …

『干货』深度强化学习与自适应在线学习的阿里实践

1搜索算法研究与实践
1.1背景
淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性。因此,…

未来已来!阿里小蜜AI技术揭秘

1. 双11的挑战与服务模式的转型
在全球人工智能领域不断发展的今天,包括Google、Facebook、Microsoft、Amazon、Apple等互联公司…