两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
代码:
Electron是否有作为游戏引擎的潜力?
有大神会mac的wifi抓包方法吗?
维护一个大型开源项目是怎样的体验?
汤姆·克鲁斯在国外算几线?
如何看待 Rust 写的 PNG 解码器比 C 实现更快?
胸大的女孩子有什么烦恼?
notion和Obsidian这两款软件选哪个?
有人说24GB和48GB内存容量是新一代电脑平台最均衡的方案,真的是这样吗?电脑内存应该如何选?
有一张巨强的显卡是什么体验?
为何中文互联网相对英文互联网的内容质量较低?
为什么个人需要公网ip?
国内大厂现在用rust的多吗?
二氧化碳人工合成淀粉技术现在怎么没动静了?
前端,后端,全栈哪个好找工作?
2025年6月了,深圳房价咋样?
儿子抑郁四年左右了,他的未来该怎么办?
为什么大部分人都认为2560x1440是2K?
同事年过40,不想工作了,想带200万左右存款去鹤岗度余生,下场如何?
***拍大尺度片子时摄影师不会看光吗?
为啥 php 还有这么多人在用啊?
山东潍坊是座什么样的城市?
如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
作为Mac用户有什么推荐的鼠标吗?
你如何看待腾讯《从何说起》,关于周深的专访?
92年的大龄剩女,还有必要结婚吗?
孩子画过什么画让你非常震惊?
养乌龟生态缸到底可行吗?
为什么现在的周杰伦生活与作品中中华元素越来越少了?
你们在公司是怎么使用k8s和docker的?
为啥软路由大多都是爱快加openwrt的组合,单openwrt有什么缺点嘛?