Claude Sonnet 4.6:最適合電腦使用和程式編寫
Claude Sonnet 4.6是Anthropic旗下功能最強大的 Sonnet 模型之一,在編碼、agent規劃和知識工作方面都有全面升級。它在保持高度成本效益的同時,也達到了接近 Opus 等級的智能水平。
它最突出的特色是電腦使用能力大幅提升,讓AI可以像人類一樣操作軟體。它可以自主地與電腦互動,輕鬆處理跨越試算表和多步驟網頁表單的複雜任務。
這個模型還在測試階段,就已經有高達一百萬個token的上下文視窗,讓它能夠在龐大的程式碼庫或文件庫中進行深度推理。儘管具備這些尖端技術的進步,其定價仍與Claude Sonnet 4.5保持一致,起算價格為每百萬token 3/15美元。
電腦使用史無前例的突破
雖然 Sonnet 3.5 在 OSWorld 的基準測試中只拿到 14.9% 的分數,但新的Claude Sonnet 4.6卻大幅提升到72.5% 。這前所未有的進步,展現了 Anthropic 在教導 AI 自主操作標準桌面環境方面的快速發展。
Claude Sonnet 4.6不用透過客製化的 API,就能直接看到電腦畫面,並像人類一樣與電腦互動:點擊(虛擬)滑鼠、在(虛擬)鍵盤上打字。
為了降低自動化操作的風險, Anthropic大幅提升了模型對惡意提示注入攻擊的防禦能力。這種強大的安全性讓企業能夠放心地自動化其專業的舊版軟體和繁瑣的日常工作流程。
Claude Sonnet 4.6的其他更新
除了電腦使用能力, Claude Sonnet 4.6還推出了一系列模型增強功能,旨在簡化開發人員和企業用戶的工作流程。
- 思考能力: Claude開發者平台具備適應性與延伸性思考。它還引入了上下文壓縮功能,可以自動總結對話中較舊的部分,以釋放上下文空間並讓模型保持專注。
- 更聰明的API工具:在API上,Claude的網路搜尋和擷取工具現在可以編寫和執行程式碼,以過濾掉無用的資訊,確保只有相關內容保留在上下文中,以節省您的token並提高質量。
- Excel 功能升級:現在,您可以直接在 Excel 裡面,透過 MCP 連接器,將Claude連接到外部的財務和資料平台,完全不用離開您的試算表。
Claude Sonnet 4.6與其他模型比較
以下是Claude Sonnet 4.6與其他當代 AI 聊天模型比較結果的摘要:
| 對比項/基準 | Claude Sonnet 4.6 | Claude Sonnet 4.5 | Claude Opus 4.6 | Gemini 3 Pro | GPT-5.2 |
| 上下文視窗 | 一百萬個token | 一百萬個token | 一百萬個token | 一百萬個token | 40萬個token |
| 電腦使用 | 在OSWorld標準上,拿到了72.5%的高分。 | 在OSWorld標準上,得到61.4%的分數。 | 在OSWorld標準上,得到72.7%的分數。 | 對雲端和API有深厚的基礎。 | 在後端終端任務和執行鏈中佔據主導地位。 |
| 多模態 | 文字與圖片。 | 文字與圖片。 | 在文字、程式碼和視覺任務方面表現出色。 | 支援原生文字、圖片、音訊、影片和PDF檔案的處理。 | 文字與圖片。 |
| SWE-bench Verified | 79.6% | 77.2% | 80.8% | 78% | 80% |
| ARC-AGI-2 | 58.3% | 13.6% | 68.8% | 31.1% | 54.2% |
| GPQA Diamond | 89.9% | 83.4% | 91.3% | 91.9% | 93.2% |
| MMMLU | 89.3% | 89.5% | 91.1% | 91.8% | 89.6% |
如何在HIX AI上使用Claude Sonnet 4.6
如果你想試用Claude Sonnet 4.6,又不想設定 API 金鑰或操作複雜的開發者平台, HIX AI提供了一個簡便的方法,讓你馬上就能開始使用。請遵循以下簡單步驟:
- 前往HIX AI平台上的Claude Sonnet 4.6網頁。
- 請在聊天框中輸入您的指示或問題。您也可以輕鬆上傳檔案,讓這款進階模型利用其龐大的上下文視窗來處理。
- 開始和Claude Sonnet 4.6聊天,親身體驗它升級後的效能、更精準的指令遵循,以及更細膩的推理能力。
常見問題解答
Claude Sonnet 4.6 的使用費用是多少?
定價和前一代完全一樣,輸入的每一百萬個token是3美金,輸出的每一百萬個token是15美金。對於一般使用者來說,這也是Anthropic的免費和專業方案中預設可用的模型。
Claude Sonnet 4.6的上下文視窗大小是多少?
這個模型在測試階段就提供了高達一百萬個token的上下文視窗。這讓你可以一次上傳並分析整個程式碼庫、冗長的法律合約,或是數十篇研究論文,而只需要一個文字提示。
它真的能像人類一樣控制電腦嗎?
對。Claude Sonnet 4.6的電腦使用能力讓它能夠自主地與標準軟體互動,透過點擊虛擬滑鼠和在虛擬鍵盤上打字來完成複雜的多步驟工作流程,而不需要依賴後端 API。
我還需要用Claude Opus 來處理複雜的任務嗎?
大部分任務來說,不用。Claude Sonnet 4.6在編碼、推理和代理規劃方面,其智能程度已接近 Opus 等級,因此能處理繁重的工作負載。不過, Anthropic指出,對於最深層次的推理和無縫的多代理協調,Opus 系列仍然是最佳選擇。


