当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
你卡过最厉害的bug是什么?
吃爽了是怎样一种体验?
Rust开发Web后端效率如何?
你在健身房发生过什么有趣的事情?
如何看待伊朗媒体称「今晚将发生世界铭记的大事」?可能是什么?
你的亲戚提过什么过分的要求?
大家买的房子都跌了多少呀?
从零写一个3D物理引擎难度多大?
如何电脑下载Adobe audition?
如何评价浙江这个省?
你和你老婆是怎么认识的?
巴基斯坦援助伊朗防空,大家怎么看?
眼睛有飞蚊症可以自愈吗?
线上故障如何快速排查?
为什么广东的经济现在开始落后了?
为什么windows的arm版没有被广泛使用?
江西通报救护车 800 公里收费 2.8 万「不合理,暂停医院转运服务」,该医院要承担怎样的法律责任?
要不要帮导师装服务器?
海贼王为什么现在被全网黑?
公司规定所有接口都用 post 请求,这是为什么?
为什么从事技术的人普遍都比较难沟通?
俄如果真的投下了核弹,世界会如何?
你从什么时候开始感受到所谓的“资本的力量”?
周杰伦为什么不告粥饼伦黑伦侵犯他的名誉权?
做引体向上可能会诱发腰肌劳损吗?
为什么Dreamwe***er,FrontPage会被淘汰?
能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
台湾人对南京人有特殊情结吗?
如何看待alist被转手出售***?