Claude Sonnet 4.6:最适合电脑使用和编码
Claude Sonnet 4.6是Anthropic最强大的 Sonnet 模型之一,在编码、agent规划和知识工作方面进行了全面升级。它在保持高性价比的同时,达到了 Opus 级别的智能水平。
其突出特点是计算机使用能力显著提高,使人工智能能够像人类一样操作软件。它可以自主地与计算机交互,轻松处理电子表格和多步骤网络表单中的复杂任务。
该模型还提供了一个巨大的 100 万token上下文窗口(处于测试阶段),能够对大型代码库或文档库进行深度推理。尽管取得了这些前沿水平的进步,但定价仍与Claude Sonnet 4.5相同,每百万 token 起价为 3 美元/15 美元。
计算机使用取得前所未有的突破
虽然 Sonnet 3.5 在 OSWorld 基准测试中仅获得 14.9% 的分数,但新的Claude Sonnet 4.6却获得了高达72.5%的分数。这一前所未有的飞跃表明 Anthropic 在教会人工智能自主驾驭标准桌面环境方面取得了快速进展。
无需依赖定制化的 API,Claude Sonnet 4.6 能够直接观察电脑屏幕,并像人类一样与其交互:通过点击(虚拟)鼠标和在(虚拟)键盘上打字来完成操作。
为了降低自主行动的风险, Anthropic大幅提升了模型抵御恶意提示注入攻击的能力。这种强大的安全性使企业能够自信地实现其专业旧版软件和繁琐日常工作流程的自动化。
Claude Sonnet 4.6的其他更新
除了计算机使用功能外, Claude Sonnet 4.6还引入了一套模型增强功能,旨在为开发人员和企业用户简化工作流程。
- 思考能力: Claude开发人员平台具有自适应和扩展思维能力。它还引入了上下文压缩功能,可自动总结对话中较旧的部分,以释放上下文空间并使模型保持专注。
- 更智能的 API 工具:在 API 上,Claude 的网络搜索和获取工具现在可以编写和执行代码来过滤掉无用的信息,确保只有相关内容保留在上下文中,从而节省您的token并提高质量。
- Excel 改进:现在,您可以在 Excel 中直接使用 MCP 连接器将Claude连接到外部财务和数据平台,而无需离开电子表格。
Claude Sonnet 4.6与其他模型的比较
以下是Claude Sonnet 4.6与其他当代 AI 聊天模型之间的比较总结:
| 对比项/基准 | Claude Sonnet 4.6 | Claude Sonnet 4.5 | Claude Opus 4.6 | Gemini 3 Pro | GPT-5.2 |
| 上下文窗口 | 100万个token | 100万个token | 100万个token | 100万个token | 40万个token |
| 电脑使用 | 在OSWorld上获得了高达72.5%的评分。 | 在OSWorld上得分61.4%。 | 在OSWorld上获得72.7%的分数。 | 扎实的云/API基础。 | 擅长后端终端任务和执行链路。 |
| 多模态 | 文字和图片。 | 文字和图片。 | 擅长处理文本、代码和视觉任务。 | 原生文本、图像、音频、视频和 PDF 处理。 | 文字和图片。 |
| SWE-bench Verified | 79.6% | 77.2% | 80.8% | 78% | 80% |
| ARC-AGI-2 | 58.3% | 13.6% | 68.8% | 31.1% | 54.2% |
| GPQA Diamond | 89.9% | 83.4% | 91.3% | 91.9% | 93.2% |
| MMMLU | 89.3% | 89.5% | 91.1% | 91.8% | 89.6% |
如何在HIX AI上访问Claude Sonnet 4.6
如果您想试用Claude Sonnet 4.6,而又不想设置 API 密钥或浏览复杂的开发者平台, HIX AI提供了一种便利的方法,让您立即开始使用。请遵循以下简单步骤:
- 前往HIX AI平台上的Claude Sonnet 4.6网页。
- 在聊天框中输入您的指令或问题。您还可以轻松上传文件,供这款高级模型使用其庞大的上下文窗口进行处理。
- 立即开始聊天,亲身体验Claude Sonnet 4.6升级后的性能、改进的指令遵循能力和细致的推理能力。
常见问题解答
使用Claude Sonnet 4.6需要多少费用?
定价与前代产品完全相同,输入token每百万个 3 美元,输出token每百万个 15 美元。对于普通用户,它也是 Anthropic 免费和专业方案中提供的默认模型。
Claude Sonnet 4.6的上下文窗口大小是多少?
该模型在测试版中提供了一个巨大的 100 万token上下文窗口。这使您能够在一个文本提示中上传和分析整个代码库、冗长的法律合同或数十篇研究论文。
它真的能像人类一样控制电脑吗?
是的。Claude Sonnet 4.6的计算机使用能力使其能够自主地与标准软件进行交互,而无需依赖后端 API。它可以通过点击虚拟鼠标和在虚拟键盘上打字来完成复杂的、多步骤的工作流程。
对于复杂的任务,我还需要使用Claude Opus 吗?
对于大多数任务来说,不需要。Claude Sonnet 4.6在编码、推理和智能体规划方面已接近 Opus 级别的智能,使其能够胜任繁重的工作负载。然而, Anthropic指出,对于绝对最深层次的推理和完美的多智能体协调,Opus 系列仍然是最佳选择。


