构建AI电商时代技术底座,淘天集团在NeurIPS开源自动出价Benchmark

近期,随着淘天集团对外披露了其AIGX技术体系、大模型家族等技术进展,其AI技术实力引发外界更多关注。

图片来源: 图虫创意

近期,随着淘天集团对外披露了其AIGX技术体系、大模型家族等技术进展,其AI技术实力引发外界更多关注。有报道显示,淘天集团过去5年发表在国际顶会的论文数量超过300篇,同时阿里妈妈团队发明并申请中国专利130项以上,其中超过20项已经正式获批授权。

此外记者还了解到,淘天集团至今已开源了多个AI项目,且多个模型排名开源社区趋势榜前列。

值得一提的是,在人工智能顶会NeurIPS 2024上,淘天集团阿里妈妈团队就开源了世界首个标准化的自动出价Benchmark——AuctionNet,该数据集中包含了48个不同出价智能体相互竞价的日志,共有5亿条记录,共计80GB。

AuctionNet不仅适用于广告拍卖中的出价决策算法研究,也适用于大型博弈场景的决策智能算法研究。在NeurIPS 2024竞赛上AuctionNet已投入应用,为1500支队伍提供了近万次准确、公正的算法效果评估,并帮助选手研发更多元、创新性的解决方案。

在智能创意方向,淘宝天猫仅去年一年就开源了多个项目,如基于FLUX(FLUX.1-dev)的配套模型ControlNet 图像修复模型以及8步加速的 Turbo模型,两个模型可互相兼容配合使用,达到更快的修复生图速度。

两项模型开源后很快收到了社区积极反馈,在 HuggingFace 社区居于趋势榜前列。

image

两个模型均排名开源社区趋势榜前列 2024.10.16,图片来源:企业供图

ChatGPT掀起大模型浪潮后,淘天集团还曾联合爱橙科技于2023年9月对外开源大模型训练框架——Megatron-LLaMA,让开发者们能够更方便地提升大语言模型训练性能,降低训练成本,并且保持和 LLaMA 社区的兼容性。测试显示,在32卡训练上,相比HuggingFace上直接获得的代码版本,Megatron-LLaMA能够取得176%的加速;在大规模的训练上,Megatron-LLaMA相比较32卡拥有几乎线性的扩展性,而且对网络不稳定表现出高容忍度。

此外,淘宝天猫一直保持开源的传统,和业界共享AI技术红利,已经开源了包括DIN(深度兴趣网络)、XDL(阿里自研深度学习框架)、EULER(分布式高性能图表示学习框架)、CLF(曲率空间学习框架)、EFLS(联邦学习解决方案)等在内的很多AI模型和平台。

AI电商方兴未艾,淘天集团正在持续大量储备AI领域技术人才。据公开报道,过去两年内,淘天集团启动多轮校招,技术类岗位占比持续增加;又连续两年发起T-Star全球顶尖技术人才计划,开出定制化培养、百万年薪等待遇。

 
未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

构建AI电商时代技术底座,淘天集团在NeurIPS开源自动出价Benchmark

近期,随着淘天集团对外披露了其AIGX技术体系、大模型家族等技术进展,其AI技术实力引发外界更多关注。

图片来源: 图虫创意

近期,随着淘天集团对外披露了其AIGX技术体系、大模型家族等技术进展,其AI技术实力引发外界更多关注。有报道显示,淘天集团过去5年发表在国际顶会的论文数量超过300篇,同时阿里妈妈团队发明并申请中国专利130项以上,其中超过20项已经正式获批授权。

此外记者还了解到,淘天集团至今已开源了多个AI项目,且多个模型排名开源社区趋势榜前列。

值得一提的是,在人工智能顶会NeurIPS 2024上,淘天集团阿里妈妈团队就开源了世界首个标准化的自动出价Benchmark——AuctionNet,该数据集中包含了48个不同出价智能体相互竞价的日志,共有5亿条记录,共计80GB。

AuctionNet不仅适用于广告拍卖中的出价决策算法研究,也适用于大型博弈场景的决策智能算法研究。在NeurIPS 2024竞赛上AuctionNet已投入应用,为1500支队伍提供了近万次准确、公正的算法效果评估,并帮助选手研发更多元、创新性的解决方案。

在智能创意方向,淘宝天猫仅去年一年就开源了多个项目,如基于FLUX(FLUX.1-dev)的配套模型ControlNet 图像修复模型以及8步加速的 Turbo模型,两个模型可互相兼容配合使用,达到更快的修复生图速度。

两项模型开源后很快收到了社区积极反馈,在 HuggingFace 社区居于趋势榜前列。

image

两个模型均排名开源社区趋势榜前列 2024.10.16,图片来源:企业供图

ChatGPT掀起大模型浪潮后,淘天集团还曾联合爱橙科技于2023年9月对外开源大模型训练框架——Megatron-LLaMA,让开发者们能够更方便地提升大语言模型训练性能,降低训练成本,并且保持和 LLaMA 社区的兼容性。测试显示,在32卡训练上,相比HuggingFace上直接获得的代码版本,Megatron-LLaMA能够取得176%的加速;在大规模的训练上,Megatron-LLaMA相比较32卡拥有几乎线性的扩展性,而且对网络不稳定表现出高容忍度。

此外,淘宝天猫一直保持开源的传统,和业界共享AI技术红利,已经开源了包括DIN(深度兴趣网络)、XDL(阿里自研深度学习框架)、EULER(分布式高性能图表示学习框架)、CLF(曲率空间学习框架)、EFLS(联邦学习解决方案)等在内的很多AI模型和平台。

AI电商方兴未艾,淘天集团正在持续大量储备AI领域技术人才。据公开报道,过去两年内,淘天集团启动多轮校招,技术类岗位占比持续增加;又连续两年发起T-Star全球顶尖技术人才计划,开出定制化培养、百万年薪等待遇。

 
未经正式授权严禁转载本文,侵权必究。