当前位置: 首页 > 科技资讯 > 武汉大学携手中国移动九天AI团队:VoxBlink2音视频辨认数据集开源问世

武汉大学携手中国移动九天AI团队:VoxBlink2音视频辨认数据集开源问世

发布时间:2024-08-21 01:01:19 作者:001资源网 阅读:0次

近日消息,武汉大学携手中国移动九天人工智能团队及昆山杜克大学,震撼公布了一项重大资源——VoxBlink2音视频说话人识别数据集。

武汉大学携手中国移动九天AI团队:VoxBlink2音视频辨认数据集开源问世

该数据集突破性地涵盖了超过11万小时的珍贵音视频材料,收集自YouTube平台上的11万余名用户,涉及990万个高质音频与对应视频片段,问鼎当前最大公开音视频说话人识别数据库。此举意在拓宽开源领域,为声纹识别大模型的研究与训练注入强大动能。

VoxBlink2数据集通过以下步骤进行数据挖掘:

候选人准备:收集多语种关键词列表,检索用户视频,选取前一分钟视频用于处理。

人脸提取&检测:高帧率抽取视频帧,使用MobileNet检测人脸,确保视频轨仅含单个说话人。

人脸识别:预训练人脸识别器逐帧识别,确保音视频片段来源于同一人。

活动说话人检测:利用唇动序列和音频,通过多模态活动说话人检测器输出发声片段,混叠检测去除多说话人片段。

为提高数据准确率,还引入了集内人脸识别器的旁路步骤,通过粗略人脸提取、人脸验证、人脸采样和训练,将准确率从72%提高到92%。

VoxBlink2还开源了不同大小的声纹模型,包括基于ResNet的2D卷积模型和基于ECAPA-TDNN的时序模型,以及基于Simple Attention Module的超大模型ResNet293。这些模型在Vox1-O数据集上经过后处理后可达0.17%的EER和0.006%的minDCF。

《中国移动》注销账号具体操作步骤介绍

《中国移动》注销账号具体操作步骤介绍,然而,有时候我们可能因为各种原因需要注销自己的账号,具体该怎么操作呢,有兴趣了解更多的一定不要错过小编整理的内容。

中国移动app怎么注销账号?

1、打开【中国移动】APP,选择【我的】,在选择右上角齿轮【设置】

2、找到【账号与安全】,点击

3、点击【注销服务】

4、勾选【申请注销即表示您已阅读及同意以上信息】,点击【确定申请】,完成。

《中国移动》注销账号具体操作步骤介绍

中国移动、中兴通讯、高通强强联合,实现单用户下行速率峰值9Gbps新纪元

近日消息,高通中国联合中国移动研究院与中兴通讯,共同宣布成功验证5G Advanced技术中的高低频段多载波聚合方案。通过采用创新的NR-CA组合方式,此次合作不仅彰显了技术突破,还实际演示了显著提升的网络速率体验,为5G后续发展奠定了坚实基础。

中国移动、中兴通讯、高通强强联合,实现单用户下行速率峰值9Gbps新纪元

此次验证利用 800MHz 带宽与 2.6GHz 频段的 100MHz 带宽进行载波聚合,并且首次采用 1024QAM 高阶调制方式,实现单用户下行峰值速率达 9Gbps(1.125GB/s)的新突破。

此次三方联合实现了端到端的 NR-CA 技术验证,采用搭载骁龙 X80 5G 调制解调器及射频系统的智能手机形态终端,以及中兴通讯的毫米波 AAU 设备。

中国移动app官方版
中国移动app官方版

平台:安卓

类型:生活休闲

版本:v5.2.0.0.8.9

大小:22.74MB

更新:2024-07-26

标签: 中国移动

查看详情

渝ICP备20008086号-39 违法和不良信息举报/未成年人举报:linglingyihcn@163.com

CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved