两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
养乌龟生态缸到底可行吗?
JetBrains 放弃 AppCode 是否是一个错误决定?
中医把脉是***吗?
J***aScript 已经强大到什么程度了?
伊朗那么大却被一个小小的以色列打的无法还手?很多高层领导都被干掉了为什么?
如何看待极客湾评测麒麟X90的性能与表现?
你读过的最好的 Rust 开源代码是什么?
真的有这种又苗条身材又爆炸的么?
印度是真的烂还是咱们在信息茧房里面?
老板说我设计了一周的海报还是不行,我到底该怎么学啊?
多个充电宝或电芯品牌的 3C 认证证书被暂停,涉及罗马仕、安克、绿联、倍思、安普瑞斯等,发生了什么?
为什么有的人喜欢带着 MacBook 去咖啡店或者书店上网,而不是 ThinkPad 之类的?
如何评价阿里等大厂笔试现已经禁用本地IDE?
比亚迪最近绩效减半,这是卸磨杀驴么?
docker有哪些有趣的用途?
如何评价基努•里维斯的演技?