当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
为什么一部分 Go 布道师的博客不更新了?
程序员用 Mac mini m4有必要买24G+的吗(非主力机)?
为什么 CRT 画质这么好也被淘汰,液晶反而发展的很好?
你是因为什么肥胖起来的?
怎么才能有尤雨溪一半强,该怎么学习?
为什么说Mac编程是种享受?
如何理解「男人至死是少年」这句话?
照骗能骗到什么程度?
为什么山姆这么受欢迎?
为什么 macOS 上国产软件不流氓?
谷歌云服务宕机导致 OpenAI、Shopify 等服务中断,此次宕机的具体技术原因是什么?
MacOS真的比Windows流畅吗?
为什么中国很少有人使用linux?
为什么中国电信的iptv一定要有网线连接!?
lcd屏幕如此护眼,为什么现在没有了?
人类真的想象不出从来没见过的东西吗?
女生怎么穿才算暴露吗?
《海贼王》里,为何赤犬作为很早就出场的强者,他的压迫感没有掉价?
能否对比一下Claude Code和Gemini CLI,你的选择建议是?
实体店为什么生意越来越难做了?
离百万年薪最近的人工智能专业,会沦为新的天坑专业吗?
女子被闺蜜按水中后续如何?
如何评价《一人之下》第722(765)话情报?
香港优才最近很火爆,如何申请?
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
AI 都能写代码了,还要学计算机吗?
学计算机的要把这些书都全部看完吗?
高考真的人生的转折点吗?
字节引入Rust是否代表J***a的缺点Go也没解决?
如何判断鱼缸中的硝化系统是否已经成功建立?