Claude3.7sonnet于2月25日已上线,以下信息如有错误,感谢指正
欢迎转载,请保留作者和原文链接
奇怪的名字
推测因为Claude3.5 240620是内部的3.5,241022(即3.5v2)是内部的Claude3.6,这个250225,就叫3.7了我以前挺爱用Claude的,不过更新实在是慢,已经4个多个月没啊更新了,AI圈一天,人间一年,AI圈里四个月已经是很长时间了
为什么不叫4.0呢,估计是没有突破性进展,不好意思叫4.0
最近一个月AI界风起云涌,deepseek出了r1,gemini出了2.0,gpt出了o3mini和o3(deep research),xai出了grok3,Anthropic如果还啥也不出,实在跟用户和投资者不好交代啊
API
价格:与3.5一样,输入$3/mtokens,输出$15,缓存读$0.3,缓存写$3.75因为开推理也是这个单价,但是推理过程也算输出token,实际token数和总价比不开推理,要翻一到几倍
o3mini都因为deepseek压力而降价了,输出才$4.4,刚刚好是r1的一倍,说不受r1影响,哪会有这么巧合的价格。o3mini只有3.7sonnet推理版价格的30%
API版上下文窗口:总上下文与3.5一样200k
API版最大输出:不设置参数默认8k,设置参数最大128k
为什么所有大模型的API版都比Chat版上下文窗口和最大输出多很多呢?因为API你自己花钱,输入输出越多官方赚越多。Chat版包月固定价格,输出越多官方越吃亏
API开启推理,设置推理长度,设置最大输出方法
3.7API的推理与o3mini分high,med,low三档不同,是取决于你设的推理token数,越大性能越高,相应成本也越贵,理论上单次提问总成本最高可以达到3.5的16倍(3.7最大输出128k÷ 3.5最大输出8k)Cherry Studio → 新建助手 → 模型设置
添加参数 → betas → JSON → [“output-128k-2025-02-19”]
如需设置最大输出,点添加参数 → max_tokens → 数字 → 128000(系统会自动改成128000.00,无影响)
微信图片_20250225090615793×756 24.9 KB
设置后测试:随便找短几十k长文,要求一字不差复述或翻译,输出token超过8k,即代表生效
最大输出这个参数,用OpenRouter测试生效。推理参数还没测,不确定是否生效
微信图片_20250225091104715×185 4.19 KB
如需开启推理,点添加参数 → thinking → JSON → {“type”: “enabled”, “budget_tokens”: 32000},这个参数,貌似没有生效,暂不确定是参数的原因还是OpenRouter的原因,如果有佬友知道,请留言
参考:Building with extended thinking - Anthropic
API渠道
官网API已上线:Build with Claude \ AnthropicOpenRouter已上线:Claude 3.7 Sonnet - API, Providers, Stats | OpenRouter
有官方,aws,google三个服务商,价格一样
API联网方法
官方不支持API联网,可以通过以下方法联网ⒶCherryStudio+Tavily API Key每月免费1000次联网
方法:更新到CherryStudio最新1.0版 → 到tavily.com注册,免费申请一个apikey → 填到Cheery>设置>联网里 → 点亮提问框联网(地球)按钮
微信图片_20250225091350726×732 35.1 KB
ⒷNextChat+Webpilot插件免费联网
ⒸOpenRouter的Chat room里有联网按钮
方法:登录Chatroom | OpenRouter → 模型选3.7sonnet → 点亮提问框联网按钮
ⒹOpenRouter自带联网功能:任意前端+OpenRouter API Key
方法:添加模型名时名不要用搜索,而是手动填 anthropic/claude-3.7-sonnet
nline ,每千次查询$4Claude2API逆向
应该很快,因为跟Claude3.5的逆向方法应该一样Cursor版
2月25日3.7和3.7 thinking已经上线当天thinking因为稳定性问题,又下线了。3.7还在
Chat版
Chat版免费会员限量
可用3.7sonnet,有限量,限量多少暂不确定,但以anthoropic一贯的抠门,限量估计不多。另外现在3.5haiku免费会员不给用了
免费版没有推理
免费Chat版上下文窗口:实测约32k
免费Chat版最大输出:实测约8k
Chat版收费会员限量
收费Chat版上下文窗口和最大输出,暂不确定是否与免费版相同收费版有Normal和Extended两档推理。但注意收费版也经常被封号,学会搞纯净IP之前,最好不要随便充会员,还是API比较保险
gpt或grok那样是是按照次数限量,不计算每次token。
claude会员是限总token数,因此使用推理,尤其是extended会显著减少每日提问次数,有佬友说有人爆料会推出一种付费重置使用限量的功能,能一次性的付费跳过限量的冷却期
▣690×486 39.3 KB
Chat版功能
上传文件:20个,每个最大30m多模态:可以识别图片,不能识别语音视频
github:新功能,可以连到你自己的github,作为上传文件
联网,深度搜索,深度研究,语音模型,文生图:与3.5一样,一概都没有,现在只要是个大模型Chat版,都有联网了,不知道A社怎么想的
Claude Code:官方介绍是一款面向开发者的命令行工具,目前以有限研究预览的形式发布。该工具支持代码搜索、阅读、编辑、测试运行、GitHub 提交以及命令行操作等多项功能,能够大幅度缩短开发时间,提升测试驱动开发和复杂问题调试的效率。
评测
代码能力
以前Claude一直是代码第一,码农是Claude的基本盘,一定要守住,如果代码再失守,Claude就危险了Lmarena:250225时还未有评测
参考:https://lmarena.ai/?leaderboard
Livebench:3.7非推理版比3.5提升微小,3.7推理版比3.5提升大,但成本也是几倍(单价一样,输出token几倍)
参考:LiveBench
微信图片_202502251055411223×515 28.5 KB
Aider:可见3.7推理成本是3.5成本2.5倍
微信图片_20250225124424738×830 22.5 KB
参考:Aider LLM Leaderboards | aider
下图是官方图,官方一般只挑对自己有利的,你懂得,还是要看第三方评测
08bba4487fb5ac1ba52540ee656d7e4da10ca1be-1920x11451920×1145 27.1 KB
智能体工具使用
自称智能体很强,下图是官方图
787e59d548c230afd7efaed1bda1fb7f7ca207b8-1920x11141920×1114 25.9 KB
数学能力
普通版数学一般,推理版数学不错推理能力
下图是官方图
9AF908C4-A4E1-443a-B66C-C67A9D6D1ECB1230×978 136 KB
热度
谷歌搜索热度:
微信图片_202502250410041278×523 40 KB
Google Play:Claude app排名美国总榜107
App Store:貌似没进前200。参考今天ChatGPT总榜第一,Gork总榜第二
微信图片_20250225055952480×381 22.8 KB
一些感想
既然出了3.7,按照anthropic的速度,4.0恐怕又要几个月之后了Claude综合发展速度,尤其是c端,明显不如其他几家
估值已经被xAI反超
按这个趋势下去,感觉即将或者已经被GPT,Deepseek和Gemini挤出全球御三家行列。以后Claude可能只能和 Grok,豆包争夺第二梯队位置,或者彻底放弃C端,死守编程垂直市场