两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
男的真的会把所有衣服从上到下都扔洗衣机吗?
汤姆·克鲁斯在国外算几线?
家里想搞一个服务器,怎么才不违规?
有个漂亮女朋友是种怎样的体验?
数据库不就是增删改查一些数据吗?研发一个数据库到底难在哪了?
各位都在用Docker跑些什么呢?
目前中国程序员和美国程序员的差距在哪里?
程序员想搭建自己的服务器求指教。?
为什么李玟明明看起来那么开朗自信,却罹患抑郁症?
月之暗面 Kimi 首个 Agent 开启内测,可生成易追溯的万字报告,有哪些技术亮点?
只能选一个,你选谁?
golang比j***a编码效率高太多,为什么各大厂还在继续用j***a而不是重构整个项目?
你们是怎样看待警察这一职业的?
6月23号,美团优选突然关闭了,为什么?
如何评价《情感反诈模拟器》女演员刘梦茹最新的抖音***回应?
吴柳芳的真实水平如何?