当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
想买个鱼缸,听说里面坑很多,哪个大神给讲解一下呀?
真的有这种又苗条身材又爆炸的么?
商业史上有哪些降维打击的经典案例?
手机的运行内存真的有必要上16GB吗?
雷军,是真的如表现的那么真诚吗?
蒋奇明凭借《边水往事》获得白玉兰最佳男配角奖,如何评价他的演技?你对他塑造的哪些人物印象深刻?
2024年了,linux用户还用fuck Nvidia吗?
亲眼见到明星本人是什么体验?
大一计算机新生怎么合理利用github?
程序员真的需要一台 Mac 吗?
Golang 中为什么没有注解?
我上大一,需要买电脑,一共9000,但我妈说她给我3000,我心里很不舒服,怎么办?
如何看待 Mac mini M4 支持可更换 SSD?
为什么很多时候对女儿最狠的却是母亲?
你为什么在日常生活中不敢穿的太漂亮?
为什么越来越多的 SSD 不带片外缓存了?
有人对sse(server sent events)了解的吗?
为什么有些前端一直用 div 当按钮,而不是用 button?
如何设计一条 prompt 让 LLM 陷入死循环?
小米 AI 眼镜发布,售价 1999 元起,有哪些功能亮点?你看好其市场前景吗?
听说有一门技术叫windows批处理(bat),请问它有什么现实用途?
你见过最漂亮的女生长什么样?
正常人吃治疗抑郁症的药会变快乐吗?
Golang与Rust哪个语言会是今后的主流?
如何看待小米 YU7 3 分钟大定突破 20 万辆,锁单 12.2 万辆?小米汽车做对了什么?
为什么索尼和任天堂已经不存在竞争关系,两家关系却还这么差?
如何看待广西举全区之力支持柳州化解债务?为什么最近地方债又重回公众视野?
你为什么觉得资本在剥削你?
你自己觉得自己的身材好吗?
「香港四大才子」之一蔡澜去世,你对他有哪些了解?如何评价他的成就?