两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
为什么中国的高超音速导弹一款接一款的出,而美国却这么费劲?
哪个编程语言是你的最爱?
如何评价neovim 0.11?
吴柳芳的真实水平如何?
西安电动车开始上牌,最终会导致什么结果?
有哪些好看的古言追妻火葬场文?
为何年轻人上班不愿意精致打扮?
美向福尔多投 6 枚「钻地弹」,其他核设施发射了 30 枚「战斧」导弹,威力如何?伊核设施受损有多大?
如何看待求是网转载小米汽车工厂宣传片?
有没有有一两句堪称千古名句,但全篇平庸至极的诗?
降维打击是什么?
如何看待《长安的荔枝》李善德的结局?
duckdb的性能如何?
Linux 下有没有类似 Everything 的搜索工具?
如何评价DuckDB?
中国人工资不高主要原因是人口太多吧?