Replica Designer Watches: 跨境电商资讯：DeepSeek的头号黑粉

2025-03-03

2月25日，Anthropic传出了两条让DeepSeek黑粉非常兴奋的消息。

Anthropic的混合模型发布

首先，Anthropic推出了首个"混合模型"Claude 3.7 Sonnet。

在腾讯、阿里、xAI等纷纷效仿DeepSeek，发布各自的推理模型时，Anthropic采取了"一网打尽"的策略。

结合了及时应答与深度思考，摒弃了传统的多模型堆积方法。

其次，几乎与Claude 3.7 Sonnet的发布同时，《华尔街日报》报道称Anthropic即将完成一轮35亿美元的融资，估值可能高达615亿美元，是之前180亿美元估值的三倍多。

Anthropic不仅仅是一家公司，它还是OpenAI的"叛军"、硅谷的明星AI初创企业。

在过去的一个月中，这家公司还身兼"DeepSeek头号黑粉"的角色。

不断质疑V3的600万美元训练成本，甚至由其中一位联合创始人亲自撰写檄文，呼吁美国加强芯片出口控制。

如今，随着新模型的发布和融资的即将完成，Anthropic成功顶住了DeepSeek的压力。

这不仅是Anthropic的好消息，实际上，在华尔街和大众因DeepSeek质疑硅谷的高投入AI战略时，Anthropic的表现还在证明，神话尚未破灭。

对于正在融资的OpenAI等企业来说，这无疑是一个积极的信号。

DeepSeek R1推理模型推动下，OpenAI迅速推出了o3 mini，马斯克的xAI上周也发布了Grok 3并引入了Grok Reasoning。

而Anthropic此时则选择了混合模型。虽然一直有传言称Claude 4即将发布，但Anthropic实际上推出的是Claude 3.7 Sonnet。

Anthropic表示，Claude 3.7 Sonnet是市场上首个"混合模型"，将立即投入使用。

这种"混合"是业内首个在单一架构上整合实时应答和深度思考的模型。

和DeepSeek的R1模型或OpenAI的o3-mini不同，这些模型都是严格的推理模型。

在使用R1和o3-mini时，思考过程是强制的，用户只能等待，这会延长获得答案的时间。

有些问题实际上并不需要长时间的思考，这时就需要用户来判断并切换到及时应答模型。

但在Claude 3.7 Sonnet这种混合模型中，用户不需要切换就可以获得实时应答或深度思考。

"这个模型整合了所有功能——我们的目标是拥有一个能适用于各种场景的统一AI。会感到更加简单。

"Anthropic的联合创始人兼首席科学家贾雷德·卡普兰（Jared Kaplan）表示。

卡普兰将其比作人类大脑的运行方式：有些问题需要深度思考，有些则需要快速回答。Claude 3.7 Sonnet将这两种能力整合在一个模型中。

除此之外，用户还可以利用"草稿"功能，在问题比较复杂时指导模型进行更精确的思考；

API用户还可以精确控制Claude 3.7 Sonnet的思考时长，甚至控制预算，例如最多思考多少个tokens。

在模型表现上，相比于上一代Claude 3.5 Sonnet，"Claude 3.7 Sonnet在遵循指令、推理、多模态能力和自主编码方面表现出色，尤其是在数学和科学领域，扩展思维能力得到了显著提升。"

模型表现与市场反馈

数学和编码能力提高了10%，尤其是编码能力，在多个测试中表现突出。

根据SWE Bench测试数据，Claude 3.7的代码能力大幅超越DeepSeek R1、OpenAI的o1、o3模型。专注于AI编程的公司Cursor已经宣布将集成Claude 3.7 .........

2月25日，Anthropic传出了两条让DeepSeek黑粉非常兴奋的消息。01Anthropic的混合模型发布首先，Anthropic推出了首个"混合模型"Claude 3.7 Sonnet。在腾

Replica Designer Watches