编程和数学等能力强大,网友见证魔法时刻

来源|

多知

作者|Penny

6月20日晚,OpenAI的竞争对手Anthropic在周四宣布了其迄今为止最强大的人工智能模型Claude3.5Sonnet。据介绍,Claude3.5Sonnet比其之前的模型Claude3Opus快两倍,价格只有五分之一。

Claude3.5Sonnet是Anthropic新推出的Claude3.5系列中的第一个模型,可以说是下一代版本的中间版本。

Anthropic还推出“Artifacts预览版”,用户能从中编辑和迭代AI模型生成的内容,无缝集成到自己的项目和工作流程中。

根据Anthropic介绍,Claude3.5Sonnet

在覆盖阅读、编程、数学和视觉等领域的多项性能测试中性能略胜一筹,超过GPT-4o等一众竞争对手的AI模型,且优于自家旗舰模型Claude3Opus。

Anthropic称,在得到指导和相关工具后,Claude3.5Sonnet可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。它可以轻松处理代码转换,使其特别适合更新旧版应用程序和迁移代码库。

全球网友开始试用Claude3.5Sonnet,可以看到,其最强大的能力是编程能力。

比如网友AllieK.Miller利用Claude3.5Sonnet编写曼卡拉数学游戏。

她说:“这太疯狂了。在短短25秒内,Claude3.5Sonnet就为我编写了一个功能齐全的曼卡拉游戏应用程序,编程和数学等能力强大,网友见证魔法时刻我只提供了游戏说明的一张屏幕截图。

它完成了其余的工作:-编写了整个游戏-预览了游戏,以便我可以测试-提供了游戏规则。”

不过,AllieK.Miller很快发现有代码错误,然后告诉了Claude3.5Sonnet修复它。Claude3.5Sonnet在几秒钟内就修复了。

曼卡拉是古老的数学棋盘游戏,可能起源于公元前6000年的约旦,至今仍在全球各地流行。这个游戏由石头组成,玩家在木制游戏板上移动石头,将所有石头放入棋盘末端的最后一个坑中是游戏的关键。

来看看Claude3.5Sonnet的设计效果:

网友JoãoMontenegro用Claude3.5Sonnet制作了一个threejs cannonjs3d太阳系,其中包含物理和碰撞。

来看看实际效果:

网友Janet认为,Claud呃推出的Artifact过于强大,可瞬间写完一个网站,速度非常快,简直是“神圣的魔法时刻”。

网友calixhuang用Claude3.5Sonnet生成了一张芯片制作过程的图。

可以看到,Claude3.5Sonnet视觉能力比较强,不仅清晰制作出各种静态图片,利用工具还能制作动图、动画。

网友TimothyB.Lee让Claude3.5Sonnet判断“100便士和三个25美分硬币,谁更有价值?”

Claude3.5Sonnet首先给出答案是“三个25美分硬币更有价值”。

后来通过解析:100便士=1美元,三个25美分=0.75美元

最终认为:“0.75美元小于1美元,所以100便士比三个25美分更有价值。”

很明显,Claude3.5Sonnet给出了两个截然相反的答案。

TimothyB.Lee说“你自相矛盾”。Claude3.5Sonnet马上道歉,说“自己错了”,然后经过推导,最后才得出结论“100便士更有价值”,并再次致歉。

可以看到,Claude3.5在一些数学问题上可以解答出来,但是它可能并不知道自己给出答案的底层逻辑,以至于“思维混乱”。

TimothyB.Lee总结说:“到目前为止,Claude3.5总体上给我留下了深刻的印象,但它有时仍然会犯一些愚蠢的错误。”

总体而言,Claude3.5Sonnet有很大的进步,但是幻觉问题依然存在。

Claude的运营公司Anthropic被认为是OpenAI最大的竞争对手,由前OpenAI研究高管创立,曾得到了包括Google、Salesforce和Amazon在内的投资者支持。在过去一年中,Anthropic完成了五笔不同的融资交易,总计约73亿美元。

免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:无敌椰子

分享:

扫一扫在手机阅读、分享本文

评论

最近发表