
Python
我用claude3 opus api加上各种功能来测试代码能力。总体而言,opus的水平在刷榜时显示超过gpt4,但我个人感觉,我有自己的场景代码,其中多数是强制使用某些比较冷门的第三方库来编写算法,例如用
Python调用blender编写一些奇特的图形学代码。在这种情况下,它整体比
ChatGPT4稍差一点,有一定概率写出完全无法使用的算法,虽然逻辑正确,但库接口完全错误,并且缺乏通用性。在其他热门库方面,感觉它和gpt4差不多了,像编写torch之类的。不过claude写代码有一种赛博莎士比亚的风格,有点剑走偏锋,就是让人看起来不像gpt那么机械和刻板。它的价格和速度倒是比gpt4好多了。然而,每个大模型的测试都像饭圈一样,我也只是根据自己的场景测试得出结论,目前要在我的场景中用claude代替gpt4,我还是有点没信心。