2025-03-03

跨境电商资讯:DeepSeek的头号黑粉

2月25日,Anthropic传出了两条让DeepSeek黑粉非常兴奋的消息。

01

Anthropic的混合模型发布

首先,Anthropic推出了首个"混合模型"Claude 3.7 Sonnet。

在腾讯、阿里、xAI等纷纷效仿DeepSeek,发布各自的推理模型时,Anthropic采取了"一网打尽"的策略。

结合了及时应答与深度思考,摒弃了传统的多模型堆积方法。

其次,几乎与Claude 3.7 Sonnet的发布同时,《华尔街日报》报道称Anthropic即将完成一轮35亿美元的融资,估值可能高达615亿美元,是之前180亿美元估值的三倍多。

Anthropic不仅仅是一家公司,它还是OpenAI的"叛军"、硅谷的明星AI初创企业。

在过去的一个月中,这家公司还身兼"DeepSeek头号黑粉"的角色。

不断质疑V3的600万美元训练成本,甚至由其中一位联合创始人亲自撰写檄文,呼吁美国加强芯片出口控制。

如今,随着新模型的发布和融资的即将完成,Anthropic成功顶住了DeepSeek的压力。

这不仅是Anthropic的好消息,实际上,在华尔街和大众因DeepSeek质疑硅谷的高投入AI战略时,Anthropic的表现还在证明,神话尚未破灭。

对于正在融资的OpenAI等企业来说,这无疑是一个积极的信号。

DeepSeek R1推理模型推动下,OpenAI迅速推出了o3 mini,马斯克的xAI上周也发布了Grok 3并引入了Grok Reasoning。

而Anthropic此时则选择了混合模型。虽然一直有传言称Claude 4即将发布,但Anthropic实际上推出的是Claude 3.7 Sonnet。

Anthropic表示,Claude 3.7 Sonnet是市场上首个"混合模型",将立即投入使用。

这种"混合"是业内首个在单一架构上整合实时应答和深度思考的模型。

和DeepSeek的R1模型或OpenAI的o3-mini不同,这些模型都是严格的推理模型。

在使用R1和o3-mini时,思考过程是强制的,用户只能等待,这会延长获得答案的时间。

有些问题实际上并不需要长时间的思考,这时就需要用户来判断并切换到及时应答模型。

但在Claude 3.7 Sonnet这种混合模型中,用户不需要切换就可以获得实时应答或深度思考。

"这个模型整合了所有功能——我们的目标是拥有一个能适用于各种场景的统一AI。会感到更加简单。

"Anthropic的联合创始人兼首席科学家贾雷德·卡普兰(Jared Kaplan)表示。

 卡普兰将其比作人类大脑的运行方式:有些问题需要深度思考,有些则需要快速回答。Claude 3.7 Sonnet将这两种能力整合在一个模型中。

除此之外,用户还可以利用"草稿"功能,在问题比较复杂时指导模型进行更精确的思考;

API用户还可以精确控制Claude 3.7 Sonnet的思考时长,甚至控制预算,例如最多思考多少个tokens。

在模型表现上,相比于上一代Claude 3.5 Sonnet,"Claude 3.7 Sonnet在遵循指令、推理、多模态能力和自主编码方面表现出色,尤其是在数学和科学领域,扩展思维能力得到了显著提升。"

02

模型表现与市场反馈

数学和编码能力提高了10%,尤其是编码能力,在多个测试中表现突出。

根据SWE Bench测试数据,Claude 3.7的代码能力大幅超越DeepSeek R1、OpenAI的o1、o3模型。专注于AI编程的公司Cursor已经宣布将集成Claude 3.7 .........

2月25日,Anthropic传出了两条让DeepSeek黑粉非常兴奋的消息。01Anthropic的混合模型发布首先,Anthropic推出了首个"混合模型"Claude 3.7 Sonnet。在腾

原文转载:https://www.kjdsnews.com/a/2087162.html

亚马逊赶跟卖大全,总有一种搞定跟卖玩家! 一季度总收入达到1346亿美元!沃尔玛发力追赶亚马逊 本地化成大趋势!跨境大卖都做了哪些本地仓储布局 亚马逊卖家需要注意的5个事项,避免把自己的店铺玩坏了! 叫板亚马逊? Facebook启动电商业务!Shopify第一季度GMV突破1252.8亿…… eBay:海外仓服务标准未达标的卖家帐号将受限或冻结 一夜蒸发1000万泰铢!"海外仓噩梦"在东南亚上演 DeepSeek的头号黑粉乐坏了!

No comments:

Post a Comment