两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
身材丰满有哪些烦恼?
华为 HDC 发布 HarmonyOS 6 开发者 beta 版对应用开发者和鸿蒙生态有哪些影响?
如何看待b站出现有关小米的大量反向标题,号称“薅千亿补贴”的现象?
Linux 内核的系统有没有类似macOS 那样漂亮流畅的桌面环境的发行版本?
有没有人***正好撞到你擅长的领域上的?
将 Windows Server 作为个人 PC 操作系统来用是怎样的体验?
如何评价综艺《心动的信号》第七季?
Golang和J***a到底怎么选?
《欢天喜地七仙女》中 「仙女下嫁凡人」 的设定,在今天是否过时?
据说go和c#的开发者都说自己比较节省内存,你们认为呢?
作为一个服务器,node.js 是性能最高的吗?
作为一个服务器,node.js 是性能最高的吗?
为什么中国红十字会腐败这么严重?
为何雷军天天健身,却无健身痕迹?
为什么买了Switch后,却发现它并没有那么好玩?
golang 与rust 在服务器程序领域相比较,各有什么优劣势?