阿里云通义开源视觉模型Qwen2.5-VL

1月28日,阿里云通义开源视觉模型Qwen2.5-VL,共推出3B、7B和72B三个尺寸版本。据介绍,Qwen2.5-VL不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!