阿里开源强化学习研究平台Gym StarCraft
星际争霸一直是游戏玩家心目中即时战略类的经典之作,历时十多年而不衰。而如今它更成为深度强化学习、人工智能算法研究的一个主要平台和工具。因为其蕴含了多智能体协作、…
干货 | 强化学习在携程酒店推荐排序中的应用探索
作者简介
宣云儿,携程酒店排序算法工程师,主要负责酒店排序相关的算法逻辑方案设计实施。目前主要的兴趣在于排序学习、强化学习等领域的理论与应用。
前言
目前携程酒…
深度强化学习、GAN与多巴胺对撞:阿里“AI 智能体”认知研讨会干货
【导读】 近年来,不管是神经科学还是计算机科学,科家们一直都在寻求跨界融合,希望由此将各自的研究往前推进。2017年4月5日,北京,阿里巴巴绿地中心,“AI 智…
『干货』深度强化学习与自适应在线学习的阿里实践
1搜索算法研究与实践
1.1背景
淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性。因此,…