当前位置: 首页 > 科技资讯 > 谷歌重磅发布Titans系列AI模型:融合长短记忆与注意力机制

谷歌重磅发布Titans系列AI模型:融合长短记忆与注意力机制

发布时间:2025-01-21 15:16:09 作者:001资源网 阅读:2次

近日消息,科技界传来一则令人振奋的消息,谷歌研究院官方发表了一则重要公告,详细公布了备受瞩目的“Titans”系列模型架构。这一全新的架构,宛如科技领域的一颗璀璨明珠,吸引了众多目光。

谷歌重磅发布Titans系列AI模型:融合长短记忆与注意力机制

目前业界流行的 Transformer 模型架构虽然在大多数场景表现优秀,但其上下文窗口(Window)长度的限制,通常仅为几千到几万个 Token,这使得它们在处理长文本、多轮对话或需要大规模上下文记忆的任务中,往往无法保持语义连贯性和信息准确性。

而谷歌这一 Titans 系列模型架构通过引入深度神经长期记忆模块(Neural Long-Term Memory Module)有效解决了相应问题,其设计灵感号称来自人类的记忆系统,结合了短期记忆的快速反应与长期记忆的持久特性,并通过注意力机制来着重执行当前的上下文(着重于用户即时输入的提示词,并保留对于以往提示词的准确记忆)。

参考论文获悉,Titans 具有三种架构设计变体,分别是 Memory as a Context(MAC)、Memory as a Gate(MAG)和 Memory as a Layer(MAL),可以根据不同的任务需求整合短期与长期记忆。其中“MAC”架构变体将长期记忆作为上下文的一部分,允许注意力机制动态结合历史信息与当前数据,适合处理需要详细历史上下文的任务。“MAG”架构变体则根据任务需求,调整实时数据与历史信息的重要性比例,专注于当前最相关的信息。

谷歌重点强调了“MAL”架构变体,该架构主要将记忆模块设计为深度网络的一层,也就是从模型设计层面,直接将用户的历史记录和现在输入的上下文内容进行固定压缩,之后交由模型的注意力模块处理,因此效率相对较高,但输出内容效果不如“MAC”和“MAG”变体。

谷歌声称,Titans 系列模型架构在长序列处理任务中的表现明显优于现有模型,无论是语言建模还是时间序列预测,Titans 在准确性和效率上都展现了“压倒性优势”,甚至在某些场景中超越了如 GPT-4 等具有数十倍参数的模型。

谷歌Gemini 1.5 Pro震撼发布:多模态能力超越GPT-4o、Claude-3.5 Sonnet

近日消息,谷歌揭晓了其人工智能研究的最新成果——Gemini1.5Pro,并通过Google AI Studio搭配Gemini API,发布了实验性质的“版本0801”,旨在邀请开发者和研究人员参与早期测试,收集宝贵意见与反馈,共同推进AI技术的边界。

谷歌Gemini 1.5 Pro震撼发布:多模态能力超越GPT-4o、Claude-3.5 Sonnet

新模型迅速在著名的 LMSYS Chatbot Arena 排行榜(由 Gradio 构建)上占据榜首,其令人瞩目的 ELO 分数高达1300。这一成就使 Gemini1.5Pro 领先于像 OpenAI 的 GPT-4o(ELO:1286)和 Anthropic 的 Claude-3.5Sonnet(ELO:1271)这样强大的竞争对手。

Gemini 团队的关键人物西蒙·托库明在 X.com 上的一篇帖子中庆祝了这一发布,称其为“我们所打造的最强、最智能的 Gemini”。早期用户的反馈也支持了这一说法,一位 Redditor 称该模型“好得令人疯狂”,并希望其能力不会被削减。

Gemini1.5Pro 的新功能

Gemini1.5Pro 在众多任务中展现出强大实力,该模型在多语言任务方面表现出色,在数学、复杂提示和编码等技术领域也有强劲表现。它还在 LMSYS 的视觉排行榜上位居榜首,突显了其多模态能力。

这次发布建立在谷歌于2月推出的 Gemini1.5的基础上,1.5系列的一个突出特点是其广阔的上下文窗口,多达200万个标记,远远超过许多竞争模型。这使得 Gemini1.5Pro 能够处理和推理大量信息,包括冗长的文档、广泛的代码库以及扩展的音频或视频内容。

Gemini1.5Pro 增强的能力可能会改变企业在数据分析、软件开发和客户互动方面的运营。该模型能够高精度处理复杂的多模态输入,为各行业的自动化和决策支持开辟了新的可能性。

谷歌决定让 Gemini1.5Pro进行早期测试,反映了 AI 行业日益增长的开放开发和社区参与的趋势。通过征求开发者和用户的反馈,谷歌旨在进一步完善该模型,并在更广泛推广之前解决潜在问题。

Gemini1.5Pro 的发布代表了正在进行的 AI 竞赛中的重大举措,科技巨头和初创公司都在争夺霸主地位。其在各种任务中的表现表明,谷歌在开发更通用和强大的 AI 系统方面正在取得实质性进展。

渝ICP备20008086号-39 违法和不良信息举报/未成年人举报:linglingyihcn@163.com

CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved