2024年中,Anthropic发布了Claude 3.5 Sonnet,这款被寄予厚望的AI助手在多个评测中超越了GPT-4。作为AI工具的深度用户,我进行了为期两周的详细对比测试。
首先是理解能力。Claude 3.5在理解复杂指令和长文本方面表现出色。我上传了一份50页的行业报告,Claude不仅能准确总结核心观点,还能回答细节问题,甚至发现报告中数据不一致的地方。相比之下,GPT-4在处理长文本时偶尔会遗漏关键信息。
其次是安全性。Claude从一开始就注重AI安全,3.5版本在这方面更进一步。测试中,我尝试了一些"越狱"提示词,Claude的防御明显更强。同时,它在回答敏感话题时更加谨慎,会主动说明自己的局限性。
实用性方面,Claude 3.5有两个亮点功能。一是"Artifacts",可以实时预览生成的网页、图表等内容,非常适合前端开发和数据分析。二是代码能力,在HumanEval编程评测中,Claude 3.5的得分超过了GPT-4。
但Claude也有不足。首先是中文能力,虽然比前代有提升,但在诗词创作、成语理解等方面还是不如GPT-4。其次是生态,OpenAI有ChatGPT Plus、API、插件等完整生态,Anthropic在这方面还在追赶。
价格方面,Claude 3.5 Sonnet通过API的价格比GPT-4 Turbo便宜约50%,性价比很高。对于开发者和小团队来说,这是一个很有吸引力的选择。
总结来说,如果你需要处理长文本、注重AI安全、或者主要用于编程,Claude 3.5是更好的选择。如果你更看重中文能力和生态完整性,GPT-4仍然领先。