近日消息,巴黎奥运会期间,通义App全新推出了赛事百科全书、全民线上健身挑战与AI定制运动影像等多个特色功能。这些创新服务均依托于先进的通义大模型技术,旨在为国内体育爱好者营造前所未有的观赛互动氛围,让用户在观赏奥运盛事、参与奥运话题讨论的同时,亲身体验AI技术为体育热情增添的独特魅力与趣味性。
据了解,打开通义App,进入“巴黎2024”频道,便能体验多款AI应用。“赛事百事通”是基于通义大语言模型打造的智能体,无论查询赛事看点,还是了解赛事历史,只需简单提问,通义就能提供详尽且专业的答案。
全民云运动、AI运动写真等功能基于通义视觉大模型,采用EMO、Animate Anyone、Photo Studio等技术,用户上传一张照片,选择一款喜欢的运动模版,便能实时生成高还原的数字形象,让普通的图片生成具有表现力的视频。
上传一张照片,自己就能生成跆拳道、篮球、乒乓球等热门赛事的视频,且表情动作自然,仿佛自己变身成了赛场运动员。通义App产品运营人员告诉记者,这些AI功能一经上线便涌入大量的年轻用户进来体验和分享。“他们不仅来查询感兴趣的赛事信息,关心中国队的赛事行程,更想让自己像运动员一样‘动’起来。”
此前媒体报道,巴黎奥运会将大量采用中国AI技术,应用在赛事解说、360度直播、视觉搜索等领域。阿里巴巴的通义大模型,在与众多国际科技公司的竞争中获胜,成为奥运AI大模型应用的技术提供方。
近日消息,Qwen团队宣称将他们新研发的多模态推理模型QVQ予以开源。这一举措在人工智能领域意义非凡,意味着AI在视觉理解以及复杂问题解决能力这两个重要方面取得了关键的进展。
QVQ模型在视觉推理任务中展现出了特别的优势,特别是在需要复杂分析思维的领域。尽管QVQ-72B-Preview表现出色,但团队也指出了模型存在的一些局限性,包括语言混合和代码切换问题、可能陷入循环逻辑模式、安全和伦理考虑以及性能和基准限制。团队强调,尽管模型在视觉推理方面有所改善,但它无法完全替代Qwen2-VL-72B的能力,在多步骤视觉推理过程中,模型可能会逐渐失去对图像内容的关注,导致幻觉。
Qwen团队在四个数据集上对QVQ-72B-Preview进行了评估,包括MMMU、MathVista、MathVision和OlympiadBench,这些数据集旨在考察模型在视觉相关的综合理解和推理能力。QVQ-72B-Preview在这些基准测试中表现出色,有效缩小了与领先模型之间的差距。
为了进一步展示QVQ模型在视觉推理任务中的应用,Qwen团队提供了几个示例,并分享了技术博客的链接。此外,团队还提供了模型推理的代码示例,以及如何使用魔搭API-Inference直接调用QVQ-72B-Preview模型的方法。魔搭平台的API-Inference为QVQ-72B-Preview模型提供了支持,用户可以通过API调用的方式直接使用该模型。
网络通讯
42.70MB
媒体音乐
34.24MB
时尚购物
34.09MB
金融理财
46.43MB
小说阅读
69.30MB
成长教育
111.39MB
住宿驿站
27.77MB
41.54MB
摄影美学
41.66MB
棋牌扑克
211.83MB
角色扮演
268.20MB
休闲益智
45.91MB
145.30MB
73.84MB
141.71MB
传奇三国
201.42MB
85.64MB
战争塔防
68.28MB
渝ICP备20008086号-39 违法和不良信息举报/未成年人举报:linglingyihcn@163.com
CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved
通义App革新奥运观赏:全新“赛事百事通”功能,升级观赛AI互动体验
近日消息,巴黎奥运会期间,通义App全新推出了赛事百科全书、全民线上健身挑战与AI定制运动影像等多个特色功能。这些创新服务均依托于先进的通义大模型技术,旨在为国内体育爱好者营造前所未有的观赛互动氛围,让用户在观赏奥运盛事、参与奥运话题讨论的同时,亲身体验AI技术为体育热情增添的独特魅力与趣味性。
据了解,打开通义App,进入“巴黎2024”频道,便能体验多款AI应用。“赛事百事通”是基于通义大语言模型打造的智能体,无论查询赛事看点,还是了解赛事历史,只需简单提问,通义就能提供详尽且专业的答案。
全民云运动、AI运动写真等功能基于通义视觉大模型,采用EMO、Animate Anyone、Photo Studio等技术,用户上传一张照片,选择一款喜欢的运动模版,便能实时生成高还原的数字形象,让普通的图片生成具有表现力的视频。
上传一张照片,自己就能生成跆拳道、篮球、乒乓球等热门赛事的视频,且表情动作自然,仿佛自己变身成了赛场运动员。通义App产品运营人员告诉记者,这些AI功能一经上线便涌入大量的年轻用户进来体验和分享。“他们不仅来查询感兴趣的赛事信息,关心中国队的赛事行程,更想让自己像运动员一样‘动’起来。”
此前媒体报道,巴黎奥运会将大量采用中国AI技术,应用在赛事解说、360度直播、视觉搜索等领域。阿里巴巴的通义大模型,在与众多国际科技公司的竞争中获胜,成为奥运AI大模型应用的技术提供方。
阿里通义千问Qwen视觉推理模型QVQ-72B-Preview开源,开启视觉推理新共享时代
近日消息,Qwen团队宣称将他们新研发的多模态推理模型QVQ予以开源。这一举措在人工智能领域意义非凡,意味着AI在视觉理解以及复杂问题解决能力这两个重要方面取得了关键的进展。
QVQ模型在视觉推理任务中展现出了特别的优势,特别是在需要复杂分析思维的领域。尽管QVQ-72B-Preview表现出色,但团队也指出了模型存在的一些局限性,包括语言混合和代码切换问题、可能陷入循环逻辑模式、安全和伦理考虑以及性能和基准限制。团队强调,尽管模型在视觉推理方面有所改善,但它无法完全替代Qwen2-VL-72B的能力,在多步骤视觉推理过程中,模型可能会逐渐失去对图像内容的关注,导致幻觉。
Qwen团队在四个数据集上对QVQ-72B-Preview进行了评估,包括MMMU、MathVista、MathVision和OlympiadBench,这些数据集旨在考察模型在视觉相关的综合理解和推理能力。QVQ-72B-Preview在这些基准测试中表现出色,有效缩小了与领先模型之间的差距。
为了进一步展示QVQ模型在视觉推理任务中的应用,Qwen团队提供了几个示例,并分享了技术博客的链接。此外,团队还提供了模型推理的代码示例,以及如何使用魔搭API-Inference直接调用QVQ-72B-Preview模型的方法。魔搭平台的API-Inference为QVQ-72B-Preview模型提供了支持,用户可以通过API调用的方式直接使用该模型。
网络通讯
42.70MB
媒体音乐
34.24MB
时尚购物
34.09MB
金融理财
46.43MB
小说阅读
69.30MB
成长教育
111.39MB
住宿驿站
27.77MB
成长教育
41.54MB
摄影美学
41.66MB
棋牌扑克
211.83MB
角色扮演
268.20MB
休闲益智
45.91MB
棋牌扑克
145.30MB
休闲益智
73.84MB
角色扮演
141.71MB
传奇三国
201.42MB
棋牌扑克
85.64MB
战争塔防
68.28MB