最新实测 Claude3 与 ChatGPT Plus 对比:谁更强?

Claude3于今天凌晨正式发布,由OpenAI分裂出来的兄弟公司Anthropic推出。此次发布没有召开大型发布会,仅通过X平台发布了一条帖子。

Claude3发布
看来是对本次Claude3相当有信心。

Claude3的不同版本

Anthropic此次发布了三个版本的Claude3,分别为:Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。

  • Opus:意味着史诗级别,功能强大。
  • Sonnet:相当于十四行诗。
  • Haiku:类似于日本的三行短诗。

这三个版本的区别可以通过下图一目了然:

Claude3性能测试

Claude的免费版本仅支持Sonnet,若想使用Opus版本则需要支付20美元,与OpenAI的策略相似。ChatGPT3.5免费,ChatGPT Plus则需要付费订阅。

尽管如此,Claude的订阅定价几乎与OpenAI一致,显示出强烈的竞争意图。

在经过多次尝试后,我通过一分钟注册轻松订阅海外线上服务成功订阅了Claude,并立即开始使用。

Claude订阅

训练时间

Claude3的最新训练数据为2023年8月,而ChatGPT Plus的最新数据则为2023年4月。在训练时间上,Claude3稍占优势。

Claude训练时间

推理能力

Claude3的进化最大的一部分是推理能力,特别是在逻辑推理上。以下是一个例子:

题目:
“解释补集法的概念,并用补集法计算这道概率题:'一家公司有两个部门,A部门3个男生,2个女生,B部门4个男生,6个女生,现在要派3个人去出差,要求每个部门至少出一人,那么至少有一个女生被派出的概率是多少?'”

尽管GPT4在已经明确补集法的情况下仍然有50%的错误率,但Claude3的准确率高达90%。

Claude3推理测试

此外,Claude3还表现出极高的推理能力,即使是物理题和化学题也能轻松解答。

Claude3识图回答物理问题

对家长来说,这种推理能力为辅导孩子学习提供了极大的帮助。

Claude3识图回答化学问题

多模态能力

Claude3的多模态能力与OpenAI的GPT4V不相上下,支持绘图功能,甚至能够根据科学示意图生成图像。它的多模态能力正在全面发展,足以与OpenAI展开竞争。

Claude3性能评测

此外,Claude3还支持根据图像生成代码,这一功能无疑对开发人员而言非常有用。

Claude3根据图片写代码的能力

200K长文本优化

Claude3在处理超长文本方面表现突出,支持最长200K的文本处理,并能够准确回答相关问题。以下是一个长文本查询的实例:

问题:
“你写妙鸭相机那篇文章时,用了一个人的照片作为案例,那个人是谁?”

Claude3能够准确地识别并作出回答。

Claude3的长文本能力

Claude模型对比

Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku之间的功能差异可以通过以下三张图示一目了然:

  • Claude 3 Opus
    Claude 3 Opus能力测试

  • Claude 3 Sonnet

  • Claude 3 Haiku
    Claude 3 Haiku能力测试

总结

Claude3在推理能力、推理能力和长文本优化方面均表现优异,堪称目前最强大的AI工具之一。

然而,尽管Claude3的表现非常强劲,OpenAI依然在全球AI领域占据领先地位,预计未来推出的Sora和GPT-5将进一步超越当前的AI技术。

对于我个人而言,除了模型的能力外,可用的工具也至关重要。无论是网页浏览能力、代码解释器,还是GPTs可接入的API actions,这些都为我提供了更多的可能性。

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

如果你也想体验Claude3,可以通过一分钟注册轻松订阅海外线上服务获得访问权限。

(0)
上一篇 1天前
下一篇 1天前

相关推荐