(又从草稿箱翻出一篇本该四月写完的文章…我的草稿箱里究竟还藏着多少 TODO 啊…) 先问大家两个问题: 各家 AI 现在都做了 Deep Research,那么如何比较不同的深度研究之间的能力高低呢?***设一道题目客观上存在唯一正确答案,且相关信息线索绝对可以在互联网上搜到,在允许使用搜索引擎的情况下,你觉得自己能做出来吗?当下最先进的 AI Agent 呢?为了验证大模型、Agent 网上冲浪的能力,OpenAI 编了一套超难的试卷,里面有 …。
{dede:pagebreak/}
如何看待M4单核性能吊打9950x?
想自己做一本书,用什么排版软件?
如何评价前端组件库shadcn/ui?
正常人吃治疗抑郁症的药会变快乐吗?
用PHP写了个小框架,怎么才能得到大佬们的指点?
搞了NAS之后去哪里下载4K,8K的电影?
为什么很多人不喜欢海底捞的过度服务?
为什么微软出的软件都那么巨大?
大家有没有「大众认为是烂片但个人却喜欢看」的影片?
***拍大尺度片子时摄影师不会看光吗?
选什么作为后端比较适合我,Django. Fastapi. Flask?
你见过最恶心的邻居是什么样子?
陆奇为什么离开百度之后混得不乐观?
家里想搞个服务器,有什么好的建议方案吗?
数据库不就是增删改查一些数据吗?研发一个数据库到底难在哪了?
泰国旅游真的很危险吗?