当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
写代码的时候总是考虑太多怎么办?
服务器能否拒绝非浏览器发起的HTTP请求?
亲眼见到明星本人是什么体验?
据报道称“浏览器内核有上千万行代码”,浏览器内核真的很复杂吗?
HTTP/3 解决了什么问题,又引入了什么新问题?
小朋友到底应不应该购买SWitch?
为什么过了 15 年,在大荧幕看翻拍电影《新·驯龙高手》依然不觉得过时?
为什么 Go 语言的 Error Handling 被某些人认为是一个败笔?
如何评价小岛秀夫的游戏新作《死亡搁浅2:冥滩之上》?
一个体力无限但技术只有中甲水平的球员能在英超立足吗?
为什么有的人喜欢带着 MacBook 去咖啡店或者书店上网,而不是 ThinkPad 之类的?
如果看待林丹这句话 “网球的强度远远没有羽毛球大”?
为什么有的女生喜欢穿紧身牛仔裤?
很好奇,组NAS的玩家是如何解决上传速率的问题?
红色警戒系列当中都有哪些彩蛋?
如何看待 Mac mini M4 支持可更换 SSD?
学编程要不要买电脑?
php除了web开发还能干什么?
吴艳妮做错了什么?
2025 国内公司前端团队都在搞些什么?
老公加班过多,是逃避家庭责任吗?
一个非常漂亮的残疾女孩,会有人愿意娶吗?
你做过最抽象的事情是什么?
Mac mini M4,有必要升级24G内存吗?
除了厚重,你拒绝折叠屏的理由还有哪些?什么样的折叠屏才能打动你?
为什么不用rust重写Nginx?
什么水草扔缸里就能活?
MacOS真的比Windows流畅吗?