立即與 Claude Sonnet 4.5 聊天

Claude Sonnet 4.5：Anthropic 針對複雜任務的進階模型

Claude Sonnet 4.5 是 Anthropic 的進階 AI 模型，於 2025 年 9 月下旬發布。它在軟體開發生命週期中的程式設計任務表現出色，包括規劃、錯誤修復、維護和複雜的重構。

Claude Sonnet 4.5 在建置複雜代理程式方面也處於領先地位，是自主使用電腦的最佳 AI 模型，能夠以高準確度執行瀏覽網頁和管理試算表等真實電腦任務。

Claude Sonnet 4.5 是 Anthropic 最先進的大型語言模型，主要針對程式碼工作流程、真實世界代理程式任務和長時間自主操作進行了優化。其主要特色包括：

在 SWE-bench Verified 等程式碼基準測試中表現頂尖，在系統設計、程式碼安全性、錯誤修復和規格遵循方面表現出色。它能夠自主規劃和執行複雜的軟體專案，持續數小時或數天。
增強的代理功能實現了更好的工具協調、預測性並行執行以及與子代理程式的協調，以更高的可靠性支援複雜的多步驟工作流程。
進階的記憶體和上下文管理，包括對工具呼叫之間代幣使用情況的感知，支援多上下文和長時間執行的工作流程。
在金融、網路安全、研究和軟體工程等專業領域擁有卓越的領域知識，能夠精確執行任務。
在電腦使用任務（如瀏覽、填寫表單、錯誤恢復和試算表管理）方面表現卓越，準確度高。

Claude Sonnet 4.5 的顯著聲明包括在真實世界程式碼基準測試中表現強勁、改進的長上下文處理能力以及強大的工具使用能力，OSWorld 和 SWE-bench Verified 的分數顯示較先前 Sonnet 版本有顯著提升。

以下是 Claude Sonnet 4.5 的主要效能亮點（根據 Anthropic 和獨立基準測試報告）：

程式碼和軟體任務：Claude Sonnet 4.5 在 SWE-bench Verified（一個專注於真實世界程式碼任務的基準測試）上表現創紀錄或接近紀錄。早期報告顯示其結果處於頂級，一些追蹤器指出在某些配置下分數可達 70% 高段至 80% 低段。這標誌著在持續的多步驟程式碼工作流程方面，相較於先前的 Sonnet 版本有了顯著的進步。
真實電腦使用和任務規劃：OSWorld 基準測試報告顯示 Sonnet 4.5 在「真實電腦使用」場景中的有效性達到約 61.4%，高於 Sonnet 4.0 的 42.2%，這表明其工具使用、瀏覽器自動化和多應用程式規劃能力有所增強。
長遠程和多步驟任務：軼事和官方說明都強調模型在複雜任務（包括多小時會議）中的專注度和持久性有所改善，並具備延伸推理和規劃的能力。
上下文視窗和記憶體：Sonnet 4.5 維持了大型上下文視窗（例如，約 20 萬個代幣範圍）以支援長時間執行的任務，並在記憶體管理和代理協調方面有所增強。這支援了更持續、端對端的工作流程。
模式和延遲：該模型支援不同的模式（預設模式 vs. 延伸思考模式），這些模式通過犧牲延遲來換取更深入的推理和更高的準確性。總體訊息是，在典型配置下，可以在沒有顯著延遲的情況下實現更高準確度、更長遠的工作。

模型	效能	速度	成本	上下文視窗	最適合	備註
Claude Sonnet 4.5	最高（程式碼）	快速	中等	100 萬代幣（僅限 API）	最佳程式碼模型、大型程式碼庫、複雜程式碼任務	用於建置複雜代理程式、長時間自主操作、進階推理的最強大模型
Claude Haiku 4.5	接近前沿	最快（Sonnet 的 2 倍）	最便宜	20 萬代幣	即時聊天機器人、自動化、高頻任務	針對速度和規模進行了優化，推理深度不如 Sonnet
Claude Opus 4.1	非常高	較慢	最貴	20 萬代幣	進階程式碼、多檔案重構、精確調試	整體效能最高但速度較慢、價格較貴
Claude Opus 4	高	較慢	最貴	20 萬代幣	複雜推理、架構決策	最昂貴的模型，速度較慢
Claude Sonnet 4	非常優秀	快速	低	20 萬代幣	高流量工作流程、程式碼審查、錯誤修復、聊天機器人	平衡的模型，用於大量內容生成效率高，支援混合推理

Claude Sonnet 4.5 可透過多種便捷的方式進行存取，適合日常使用者和開發者。

存取 Claude Sonnet 4.5 最簡單的方式是在 HIX AI 上。您可以輕鬆嘗試此模型以及其他 Claude 模型，不受任何限制。
開發人員可以透過 Claude API 使用 Claude Sonnet 4.5，方法是在 Anthropic 開發者平台註冊、從帳戶設定生成 API 金鑰，並使用提供的 API 憑證整合模型。

Claude Sonnet 4.5 帶來了更佳的程式碼執行體驗，增強了創建複雜文件和簡報的能力，提升了戰略思維的深度，加快了多任務輸出速度，並改進了與用戶指令的一致性。此外，它還能在首次嘗試時產生更簡潔的程式碼，減少錯誤。

Claude Sonnet 4.5 支援多達 200,000 個標記的大型上下文窗口，使其能夠處理長文件、擴展對話和複雜的工作流程而不會丟失上下文。

是的，其可靠的知識截止日期是 2025 年 1 月底。對於此日期之後的事件或訊息， Claude Sonnet 4.5 使用即時網路搜尋在需要時提供最新的答案。

它適用於生產編碼工作流程、面向客戶的 AI 代理、即時研究、大規模內容生成以及任何需要高級功能的大容量或複雜的 AI 任務。