近日消息,在2024年的世界人工智能大会(WAIC)上,商汤科技确实展示了其创新的可控人物视频生成大模型——Vimi。
这款模型基于商汤科技在深度学习和视觉识别领域的前沿研究,它突破了传统视频生成技术的局限,允许用户仅凭一张静态图像就能创造出与指定动作相匹配的人物动态视频。
该模型支持多种驱动方式,包括视频、动画、声音和文字,具有多年积累的面部跟踪技术和对细节的精确控制能力,能够生成高一致性、光影和谐的视频内容。
Vimi的稳定性尤为突出,能够生成长达1分钟以上的单镜头人物视频,且画面效果不会随时间劣化。它还能根据人物动作调整环境场景,模拟镜头角度变化和头发抖动,提供逼真的视觉效果。此外,Vimi还支持光影变化模拟,为视频创作者提供丰富的创作自由度。
Vimi相机作为基于Vimi大模型的首款C端应用,主要面向广大女性用户,满足她们的娱乐创作需求。用户上传不同角度的高清人物图片后,Vimi相机能自动生成数字分身和不同风格的写真视频,提供多样化的生成风格。Vimi相机还支持通过单张图片生成趣味人物表情包,玩法多样,实现个性化创作。
目前,Vimi相机正开放内测,感兴趣的用户可以通过关注公众号并填写预约链接申请体验。
近日消息,商汤科技于7月19日至20日在中国联通合作伙伴大会期间,宣布与中国联通达成战略合作伙伴关系。此次合作聚焦于数字通信、行业智能化转型、AI基础设施建设、算力服务生态系统及全球算力供应等方面,旨在为大模型驱动的AI产业发展奠定坚实的基础设施基础。
根据合作协议,双方将在大模型及应用领域开展多元合作,共同为行业客户提供 AI 大模型基础设施即服务、AI 即服务、模型即服务等多种服务模式,同时联合内外资源,携手形成以上海市场为初始的大模型方案。
商汤科技联合创始人、大装置事业群总裁杨帆表示,算力、大模型、数据都会将被基础设施化,并且会形成不可分割的整体,从而降低 AI 的使用成本和门槛,让更多人都能高效开展 AI 的研究和创新,推动 AI 产业可持续发展。
谈到运营商与 AI 企业的合作时,杨帆认为,AI 企业的优势在于技术平台和软件能力,运营商的优势则是海量的场景覆盖,双方优势整合将能够更好推进 AI 基础设施的建设。
据此前报道,今年 6 月,商汤科技发布公告宣布拟配售 B 类股份,总筹 20.08 亿港元,有多家战略投资人及头部海外基金入股,现有股东增持,募集资金将用于大模型研究及产品开发等。
7月19日消息,商汤科技的联合创始人兼首席科学家王晓刚于本月17日宣告,商汤绝影引领行业潮流,成功完成了业内首个原生多模态大模型的车载部署。
该创新成果体现在车载环境下的8B模型,其初始响应时间缩短至300毫秒之内,展现出极快的启动速度,同时模型推理效能达到了每秒40个Token,全面适配当前市场上的主要计算硬件平台。
商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支持主流车载计算硬件,兼容多种主流操作系统,适配多个车载芯片的部署平台。
商汤绝影称 HyperPPL 针对车载多人场景进行优化,使得车内多人并发情况下,车端多模态大模型的模型推理效率相比单人没有明显降低。
据报道,商汤绝影此前表示,深圳首条自动驾驶公交线路采用其车辆与技术,所有驾驶操作都无需人员介入。
明年上千 TOPS 算力的车载芯片(英伟达 Thor)就会问世。基于更高算力的计算平台,商汤预计绝影多模态大模型车端部署方案的首包延迟将大幅降低,推理速度进一步提高。
网络通讯
42.70MB
媒体音乐
34.24MB
时尚购物
34.09MB
金融理财
46.43MB
小说阅读
69.30MB
成长教育
111.39MB
住宿驿站
27.77MB
41.54MB
摄影美学
41.66MB
棋牌扑克
211.83MB
角色扮演
268.20MB
休闲益智
45.91MB
145.30MB
73.84MB
141.71MB
传奇三国
201.42MB
85.64MB
战争塔防
68.28MB
渝ICP备20008086号-39 违法和不良信息举报/未成年人举报:linglingyihcn@163.com
CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved
Vimi视频创造革新:商汤科技内测新应用Vimi相机,C端用户率先体验未来摄像技术
近日消息,在2024年的世界人工智能大会(WAIC)上,商汤科技确实展示了其创新的可控人物视频生成大模型——Vimi。
这款模型基于商汤科技在深度学习和视觉识别领域的前沿研究,它突破了传统视频生成技术的局限,允许用户仅凭一张静态图像就能创造出与指定动作相匹配的人物动态视频。
该模型支持多种驱动方式,包括视频、动画、声音和文字,具有多年积累的面部跟踪技术和对细节的精确控制能力,能够生成高一致性、光影和谐的视频内容。
Vimi的稳定性尤为突出,能够生成长达1分钟以上的单镜头人物视频,且画面效果不会随时间劣化。它还能根据人物动作调整环境场景,模拟镜头角度变化和头发抖动,提供逼真的视觉效果。此外,Vimi还支持光影变化模拟,为视频创作者提供丰富的创作自由度。
Vimi相机作为基于Vimi大模型的首款C端应用,主要面向广大女性用户,满足她们的娱乐创作需求。用户上传不同角度的高清人物图片后,Vimi相机能自动生成数字分身和不同风格的写真视频,提供多样化的生成风格。Vimi相机还支持通过单张图片生成趣味人物表情包,玩法多样,实现个性化创作。
目前,Vimi相机正开放内测,感兴趣的用户可以通过关注公众号并填写预约链接申请体验。
商汤科技携手中国联通深化合作,共筑AI基础设施发展新篇章
近日消息,商汤科技于7月19日至20日在中国联通合作伙伴大会期间,宣布与中国联通达成战略合作伙伴关系。此次合作聚焦于数字通信、行业智能化转型、AI基础设施建设、算力服务生态系统及全球算力供应等方面,旨在为大模型驱动的AI产业发展奠定坚实的基础设施基础。
根据合作协议,双方将在大模型及应用领域开展多元合作,共同为行业客户提供 AI 大模型基础设施即服务、AI 即服务、模型即服务等多种服务模式,同时联合内外资源,携手形成以上海市场为初始的大模型方案。
商汤科技联合创始人、大装置事业群总裁杨帆表示,算力、大模型、数据都会将被基础设施化,并且会形成不可分割的整体,从而降低 AI 的使用成本和门槛,让更多人都能高效开展 AI 的研究和创新,推动 AI 产业可持续发展。
谈到运营商与 AI 企业的合作时,杨帆认为,AI 企业的优势在于技术平台和软件能力,运营商的优势则是海量的场景覆盖,双方优势整合将能够更好推进 AI 基础设施的建设。
据此前报道,今年 6 月,商汤科技发布公告宣布拟配售 B 类股份,总筹 20.08 亿港元,有多家战略投资人及头部海外基金入股,现有股东增持,募集资金将用于大模型研究及产品开发等。
商汤绝影领跑业界,车端首推原生多模态大模型,实现每秒40 Tokens高效处理
7月19日消息,商汤科技的联合创始人兼首席科学家王晓刚于本月17日宣告,商汤绝影引领行业潮流,成功完成了业内首个原生多模态大模型的车载部署。
该创新成果体现在车载环境下的8B模型,其初始响应时间缩短至300毫秒之内,展现出极快的启动速度,同时模型推理效能达到了每秒40个Token,全面适配当前市场上的主要计算硬件平台。
商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支持主流车载计算硬件,兼容多种主流操作系统,适配多个车载芯片的部署平台。
商汤绝影称 HyperPPL 针对车载多人场景进行优化,使得车内多人并发情况下,车端多模态大模型的模型推理效率相比单人没有明显降低。
据报道,商汤绝影此前表示,深圳首条自动驾驶公交线路采用其车辆与技术,所有驾驶操作都无需人员介入。
明年上千 TOPS 算力的车载芯片(英伟达 Thor)就会问世。基于更高算力的计算平台,商汤预计绝影多模态大模型车端部署方案的首包延迟将大幅降低,推理速度进一步提高。
网络通讯
42.70MB
媒体音乐
34.24MB
时尚购物
34.09MB
金融理财
46.43MB
小说阅读
69.30MB
成长教育
111.39MB
住宿驿站
27.77MB
成长教育
41.54MB
摄影美学
41.66MB
棋牌扑克
211.83MB
角色扮演
268.20MB
休闲益智
45.91MB
棋牌扑克
145.30MB
休闲益智
73.84MB
角色扮演
141.71MB
传奇三国
201.42MB
棋牌扑克
85.64MB
战争塔防
68.28MB