当前位置：首页 > 科技资讯 > Anthropic CEO预警：未来三年AI巨模型训练成本恐飙升至千亿级美元

Anthropic CEO预警：未来三年AI巨模型训练成本恐飙升至千亿级美元

发布时间：2024-08-02 07:33:14 作者：001资源网阅读：0次

7月8日消息，AI领域新兴企业Anthropic的掌门人Dario Amodei，在近期的一档播客访谈中透露，现阶段诸如GPT-4这类先进模型的训练开销已攀升至一亿美元左右。

更令人瞩目的是，他指出正在研发中的新一代AI大型模型，其训练成本预计将达到惊人的十亿美元，按当前汇率换算，相当于约72.94亿人民币。这一预测无疑揭示了AI技术发展背后所面临的巨大资金挑战。

当然，10 亿美元还不是“终点”。Dario Amodei 作出预测，未来三年内，AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元（当前约 7294.28 亿元人民币）。

Dario Amodei 还谈到了对通用人工智能（AGI）的看法：AGI“不会突然实现”，而是一个渐进的发展过程。新的模型建立在过去的模型的发展之上，就像人类孩童不断学习新知识。

报道称，若 AI 模型算力每年增长 10 倍，那么也可以据此推测训练模型所需的硬件也至少强大 10 倍。因此，硬件很可能是训练 AI 模型中最大的成本驱动因素。早在 2023 年，ChatGPT 就需要超过 30000 个 GPU，而 OpenAI 首席执行官阿尔特曼也曾证实，训练 GPT-4 的成本为 1 亿美元。

与此同时，马斯克也曾表达过想要购买 30 万个英伟达 B200 AI 芯片的欲望、OpenAI 和微软也正计划建造一个价值 1000 亿美元的 AI 数据中心。

Anthropic革新AI开发：自动化提示工程工具优化应用创作流程

近日消息，人工智能领域的先锋企业Anthropic披露了一项旨在革新AI应用开发模式的战略举措。该公司正式推出了一系列专注于提示工程的全新功能，这些功能专为优化其语言模型Claude在AI应用构建中的应用而设计。

Anthropic革新AI开发：自动化提示工程工具优化应用创作流程

通过简化与Claude交互的过程，Anthropic期望能够显著提升开发人员的工作效率，减少在创建和微调AI应用时所需的时间和资源。

新功能位于Anthropic Console的评估选项卡下，包括：

1，提示生成器：利用Anthropic自身的提示工程技术，将简短任务描述转化为详细提示。

2，测试套件：允许开发者上传真实示例或生成AI测试用例，评估提示在各种场景中的有效性。

3，提示比较：支持并排比较不同提示的效果，并对结果进行评分。

这些工具旨在帮助开发者快速优化提示，提高AI应用的响应质量。例如，开发者可以轻松识别并解决回答过短等问题，大大节省调试时间。

Anthropic首席执行官Dario Amodei此前强调，提示工程是企业广泛采用生成式AI的关键因素之一。虽然新工具可能无法完全取代专业提示工程师，但预计将显著降低入门门槛，并为经验丰富的工程师提高效率。

随着AI技术日益普及，Anthropic此举或将推动AI应用开发向更高效、更自动化的方向发展，值得业界持续关注。

Anthropic AI遭质疑：24小时百万次数据抓取，涉嫌网站信息过度采集

7月31日消息，Anthropic公司近期遭遇质疑，尽管其宣示以负责任的态度推进AI研发，但被曝其ClaudeBot机器人过度采集网页数据，以滋养Claude大语言模型的成长，此举引发了关于数据伦理的讨论。

Anthropic AI遭质疑：24小时百万次数据抓取，涉嫌网站信息过度采集

尽管使用网络爬虫抓取数据是人工智能行业普遍做法，但 Anthropic 因其激进程度而受到批评。

自由职业者网站 Freelancer 也表示，ClaudeBot 在四小时内访问了 350 万次，被迫对其进行屏蔽。批评者指出，Anthropic 无视网站的 robots.txt 协议，强行获取数据，与其宣称的“负责任的 AI”理念相悖。

维修团队 iFixit 首席执行官 Kyle Wiens 于 7 月 24 日发布推文，翻译如下：

@AnthropicAI，我知道你渴望获取数据，且 Claude 模型也非常聪明，但真的有必要 24 小时内访问我们的服务器 100 万次吗？

这些流量没有向我们付费，且占用了我们开发资源，这真的不太厚道。

我们的服务条款中已经明确禁止通过这种方式使用我们的内容，但你悄悄 @AnthropicAI 是怎么做的。

如果 @AnthropicAI 想要就我们内容的商业使用许可进行交流，我们愿意沟通。

Anthropic创新步伐不停歇：Claude 3 Haiku微调功能重磅上线

近日消息，人工智能领域的先锋企业Anthropic披露了一项重要更新：用户现可在Amazon Bedrock平台上对Claude3Haiku模型进行微调。

Anthropic创新步伐不停歇：Claude 3 Haiku微调功能重磅上线

这一举措标志着个性化AI应用的又一里程碑，赋予了企业和开发者前所未有的灵活性，让他们能够根据自身特定的业务场景和需求，深度定制模型的表现和技能，进而大幅提升模型在专有任务上的效能和精确度。

微调是一种常用的技术，通过创建模型的定制版本，可以提升其性能。用户需准备一套高质量的提示-完成对，作为期望的输出，微调API现已进入预览阶段，将利用这些数据生成个性化的Claude3Haiku。用户可以通过Amazon Bedrock控制台或API进行测试和优化，直至模型满足性能目标并准备好部署。

微调Claude3Haiku带来了诸多好处。首先，能够在专门任务上取得更好结果，例如分类、与自定义API的互动或行业特定数据的解释。通过微调，Claude3Haiku能够在企业关键领域中表现优异，其性能显著超过通用模型。此外，微调还能够降低生产部署的成本，并提高返回结果的速度，确保在使用Claude3Haiku时比使用Sonnet或Opus更为高效。

另一大优势是生成一致、符合品牌格式的输出，确保满足法规要求和内部协议。此外，微调过程无需深厚的技术专长，适合各类企业高效创新。客户的专有数据在AWS环境内安全存储，Anthropic的微调技术也确保了Claude3模型家族的低风险有害输出。

在实际应用中，SK Telecom作为南韩最大的电信运营商之一，利用微调Claude模型改善支持工作流程，提升客户体验。其副总裁Eric Davis表示，定制Claude显著提升了客户反馈率和关键绩效指标，微调后的模型能有效生成主题、行动项目及客户通话日志的总结。

此外，全球内容与技术公司Thomson Reuters也取得了良好的效果。该公司致力于在法律、税务、会计、合规、政府及媒体等领域提供准确、快速的一致用户体验，通过在其行业专长和具体需求上优化Claude，期待显著的改进。

微调Claude3Haiku现已在美国西部（俄勒冈）AWS区域进入预览阶段。当前支持文本微调，最大上下文长度可达32K个tokens，未来计划引入视觉能力。有关更多信息，用户可查阅AWS发布博客和文档。