阿里开源强化学习研究平台Gym StarCraft

星际争霸一直是游戏玩家心目中即时战略类的经典之作,历时十多年而不衰。而如今它更成为深度强化学习、人工智能算法研究的一个主要平台和工具。因为其蕴含了多智能体协作、…

初识滴滴交易策略之三:供需调节

本篇文章分为:
1.什么是交易市场中的供需?

供需的动态性
供需的相互作用

2.滴滴业务场景涉及的供需调节技术

供需感知和供需预测

时序预测

供…

干货 | 强化学习在携程酒店推荐排序中的应用探索

作者简介
宣云儿,携程酒店排序算法工程师,主要负责酒店排序相关的算法逻辑方案设计实施。目前主要的兴趣在于排序学习、强化学习等领域的理论与应用。
前言
目前携程酒…

深度强化学习、GAN与多巴胺对撞:阿里“AI 智能体”认知研讨会干货

【导读】 近年来,不管是神经科学还是计算机科学,科家们一直都在寻求跨界融合,希望由此将各自的研究往前推进。2017年4月5日,北京,阿里巴巴绿地中心,“AI 智…

『干货』深度强化学习与自适应在线学习的阿里实践

1搜索算法研究与实践
1.1背景
淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性。因此,…