当前位置: 首页 > 科技资讯 > Anthropic CEO预警:未来三年AI巨模型训练成本恐飙升至千亿级美元

Anthropic CEO预警:未来三年AI巨模型训练成本恐飙升至千亿级美元

发布时间:2024-08-02 07:33:14 作者:001资源网 阅读:0次

7月8日消息,AI领域新兴企业Anthropic的掌门人Dario Amodei,在近期的一档播客访谈中透露,现阶段诸如GPT-4这类先进模型的训练开销已攀升至一亿美元左右。

Anthropic CEO预警:未来三年AI巨模型训练成本恐飙升至千亿级美元

更令人瞩目的是,他指出正在研发中的新一代AI大型模型,其训练成本预计将达到惊人的十亿美元,按当前汇率换算,相当于约72.94亿人民币。这一预测无疑揭示了AI技术发展背后所面临的巨大资金挑战。

当然,10 亿美元还不是“终点”。Dario Amodei 作出预测,未来三年内,AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元(当前约 7294.28 亿元人民币)。

Dario Amodei 还谈到了对通用人工智能(AGI)的看法:AGI“不会突然实现”,而是一个渐进的发展过程。新的模型建立在过去的模型的发展之上,就像人类孩童不断学习新知识。

报道称,若 AI 模型算力每年增长 10 倍,那么也可以据此推测训练模型所需的硬件也至少强大 10 倍。因此,硬件很可能是训练 AI 模型中最大的成本驱动因素。早在 2023 年,ChatGPT 就需要超过 30000 个 GPU,而 OpenAI 首席执行官阿尔特曼也曾证实,训练 GPT-4 的成本为 1 亿美元。

与此同时,马斯克也曾表达过想要购买 30 万个英伟达 B200 AI 芯片的欲望、OpenAI 和微软也正计划建造一个价值 1000 亿美元的 AI 数据中心。

Anthropic革新AI开发:自动化提示工程工具优化应用创作流程

近日消息,人工智能领域的先锋企业Anthropic披露了一项旨在革新AI应用开发模式的战略举措。该公司正式推出了一系列专注于提示工程的全新功能,这些功能专为优化其语言模型Claude在AI应用构建中的应用而设计。

Anthropic革新AI开发:自动化提示工程工具优化应用创作流程

通过简化与Claude交互的过程,Anthropic期望能够显著提升开发人员的工作效率,减少在创建和微调AI应用时所需的时间和资源。

新功能位于Anthropic Console的评估选项卡下,包括:

1,提示生成器:利用Anthropic自身的提示工程技术,将简短任务描述转化为详细提示。

2,测试套件:允许开发者上传真实示例或生成AI测试用例,评估提示在各种场景中的有效性。

3,提示比较:支持并排比较不同提示的效果,并对结果进行评分。

这些工具旨在帮助开发者快速优化提示,提高AI应用的响应质量。例如,开发者可以轻松识别并解决回答过短等问题,大大节省调试时间。

Anthropic首席执行官Dario Amodei此前强调,提示工程是企业广泛采用生成式AI的关键因素之一。虽然新工具可能无法完全取代专业提示工程师,但预计将显著降低入门门槛,并为经验丰富的工程师提高效率。

随着AI技术日益普及,Anthropic此举或将推动AI应用开发向更高效、更自动化的方向发展,值得业界持续关注。

Anthropic AI遭质疑:24小时百万次数据抓取,涉嫌网站信息过度采集

7月31日消息,Anthropic公司近期遭遇质疑,尽管其宣示以负责任的态度推进AI研发,但被曝其ClaudeBot机器人过度采集网页数据,以滋养Claude大语言模型的成长,此举引发了关于数据伦理的讨论。

Anthropic AI遭质疑:24小时百万次数据抓取,涉嫌网站信息过度采集

尽管使用网络爬虫抓取数据是人工智能行业普遍做法,但 Anthropic 因其激进程度而受到批评。

自由职业者网站 Freelancer 也表示,ClaudeBot 在四小时内访问了 350 万次,被迫对其进行屏蔽。批评者指出,Anthropic 无视网站的 robots.txt 协议,强行获取数据,与其宣称的“负责任的 AI”理念相悖。

维修团队 iFixit 首席执行官 Kyle Wiens 于 7 月 24 日发布推文,翻译如下:

@AnthropicAI,我知道你渴望获取数据,且 Claude 模型也非常聪明,但真的有必要 24 小时内访问我们的服务器 100 万次吗?

这些流量没有向我们付费,且占用了我们开发资源,这真的不太厚道。

我们的服务条款中已经明确禁止通过这种方式使用我们的内容,但你悄悄 @AnthropicAI 是怎么做的。

如果 @AnthropicAI 想要就我们内容的商业使用许可进行交流,我们愿意沟通。

Anthropic创新步伐不停歇:Claude 3 Haiku微调功能重磅上线

近日消息,人工智能领域的先锋企业Anthropic披露了一项重要更新:用户现可在Amazon Bedrock平台上对Claude3Haiku模型进行微调。

Anthropic创新步伐不停歇:Claude 3 Haiku微调功能重磅上线

这一举措标志着个性化AI应用的又一里程碑,赋予了企业和开发者前所未有的灵活性,让他们能够根据自身特定的业务场景和需求,深度定制模型的表现和技能,进而大幅提升模型在专有任务上的效能和精确度。

微调是一种常用的技术,通过创建模型的定制版本,可以提升其性能。用户需准备一套高质量的提示-完成对,作为期望的输出,微调API现已进入预览阶段,将利用这些数据生成个性化的Claude3Haiku。用户可以通过Amazon Bedrock控制台或API进行测试和优化,直至模型满足性能目标并准备好部署。

微调Claude3Haiku带来了诸多好处。首先,能够在专门任务上取得更好结果,例如分类、与自定义API的互动或行业特定数据的解释。通过微调,Claude3Haiku能够在企业关键领域中表现优异,其性能显著超过通用模型。此外,微调还能够降低生产部署的成本,并提高返回结果的速度,确保在使用Claude3Haiku时比使用Sonnet或Opus更为高效。

另一大优势是生成一致、符合品牌格式的输出,确保满足法规要求和内部协议。此外,微调过程无需深厚的技术专长,适合各类企业高效创新。客户的专有数据在AWS环境内安全存储,Anthropic的微调技术也确保了Claude3模型家族的低风险有害输出。

在实际应用中,SK Telecom作为南韩最大的电信运营商之一,利用微调Claude模型改善支持工作流程,提升客户体验。其副总裁Eric Davis表示,定制Claude显著提升了客户反馈率和关键绩效指标,微调后的模型能有效生成主题、行动项目及客户通话日志的总结。

此外,全球内容与技术公司Thomson Reuters也取得了良好的效果。该公司致力于在法律、税务、会计、合规、政府及媒体等领域提供准确、快速的一致用户体验,通过在其行业专长和具体需求上优化Claude,期待显著的改进。

微调Claude3Haiku现已在美国西部(俄勒冈)AWS区域进入预览阶段。当前支持文本微调,最大上下文长度可达32K个tokens,未来计划引入视觉能力。有关更多信息,用户可查阅AWS发布博客和文档。

渝ICP备20008086号-39 违法和不良信息举报/未成年人举报:linglingyihcn@163.com

CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved