当前位置: 首页 > 科技资讯 > 智谱AI公开CogVideoX-5B视频生成模型,RTX 3060显卡亦能驾驭

智谱AI公开CogVideoX-5B视频生成模型,RTX 3060显卡亦能驾驭

发布时间:2024-08-28 10:20:27 作者:001资源网 阅读:0次

8月28日消息,智谱AI宣布开源其升级版视频生成模型CogVideoX-5B,相较于早前的CogVideoX-2B,此次发布的模型在视频生成的质量与视觉表现上实现了显著提升,标志着AI视频生成技术的又一重要进步,为内容创作者和研究人员提供了更加强大的工具,进一步拓宽了AI技术在多媒体内容创作领域的应用前景。

智谱AI公开CogVideoX-5B视频生成模型,RTX 3060显卡亦能驾驭

官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模型。

CogVideoX 是一个大规模 DiT(diffusion transformer)模型,用于文本生成视频任务,主要采用了以下技术:

3D causal VAE:通过压缩视频数据到 latent space,并在时间维度上进行解码来实现高效的视频重建。

智谱AI公开CogVideoX-5B视频生成模型,RTX 3060显卡亦能驾驭

专家 Transformer:将文本 embedding 和视频 embedding 相结合,使用 3D-RoPE 作为位置编码,采用专家自适应层归一化处理两个模态的数据,以及使用 3D 全注意力机制来进行时空联合建模。

智谱AI引领开源创新:CodeGeeX4-ALL-9B代码生成大模型震撼发布

近日消息,由智谱 AI 开发的 CodeGeeX 第四代模型,现已正式发布且开源。该模型属于 10B 参数以下性能最为出色、功能最为全面的代码生成大模型。自 2014 年发布第一代起,每半年便会进行一次更新,一直致力于增强代码生成的能力。

智谱AI引领开源创新:CodeGeeX4-ALL-9B代码生成大模型震撼发布

CodeGeeX提供代码补全、注释、修复、翻译等基础功能,以及联网问答、代码解释器、检索增强等高级功能,对个人用户完全免费,并在各种主流IDE中可用。个人用户数已超100万,企业版本也广泛应用于多个行业,并在中国信通院的评估中获得高评级。

CodeGeeX4系列模型的开源版本CodeGeeX4-ALL-9B,集多种编程开发功能于一体,覆盖了编程的多个场景,并在多个代码评测集上表现优异,展现了强大的代码生成能力。模型支持128K上下文,处理长代码文件,并在代码检索任务中实现100%准确度。此外,CodeGeeX4-ALL-9B是唯一实现Function Call的代码大模型,在函数调用测试中成功率超过90%。

CodeGeeX插件v2.12.0版本已全面接入第四代模型,带来更快的代码生成速度和多项功能创新,如自动生成项目README文件、长文本上下文记忆、跨文件分析和问答、本地模式支持,以及NL2SQL能力提升。这些功能增强了代码查找、理解和维护的效率,提升了开发体验。

用户可以通过升级IDE中的CodeGeeX插件或在插件市场搜索下载来体验最新技术。同时,智谱AI还发布了企业级CodeGeeX4代软硬一体机产品,提供代码仓库级补写、问答和检索增强,支持信创方案,适用于更多企业级应用场景。

渝ICP备20008086号-39 违法和不良信息举报/未成年人举报:linglingyihcn@163.com

CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved