2026-05-11#
Data: 2026-05-11 23:53:16
最近抖音上面,这种类似于【用尽一切办法,去用上 claude code 、 codex ,用上实际上最先进的大模型 chatgpt 、gemini、claude …. 你就可以逆天改命… 】等文案的视频非常多。妥妥的传递焦虑。
不知道大家有没有刷到过,我可能看这种 AI 相关的视频非常多,因此会给我推这种。
其实,这是很误导人的。这种看法非常夸张。
这些博主都是在利用人性的慕强心理,营造优越感,让观众觉得自己落后了,笨了,然后赶紧点关注。
现在 AI 其实也没那么太焦虑,大部分人都是当搜索引擎使用的。而且对于我们大部分人来讲,能使用上 chatgpt 、gemini、claude 固然是好的,但是 claude code 、 codex 这种解决问题的 agent 工具其实没必要硬上。
因为,工具是为了解决问题才存在的,差生文具多,是因为大部分花里胡哨的文具对成绩提升是杯水车薪。大部分人的生活模式不需要深度思考,很强大的 AI 对他们没啥实际意义。
如果你生活中没有具体的痛点需要这些工具去解决,那么根本就没什么意义。提出问题才是使用 AI 的前提。
《最大的问题是没有问题》
它只有在很复杂的业务里,比如编程、数学、科研等逻辑业务里会大放异彩,单纯登录上,就好像给一个厨师,安装了一个 CAD 软件一样。
我虽然也大幅度使用 codex 用于日常工作,但是我平时用 豆包 还是非常多的。因为速度超级快!而且非常方便,手机上点进去直接说话,电脑上 macOS 使用 alt + 空格 瞬间调出。
我除了工作会用到 chatgpt 和 claude 之外,其余的日常生活,我想破脑子也想不到有什么痛点非得它们才能完成。除了一些复杂的思考,会使用最先进的模型辅助外,当然也没提升多少我自己的实力。
当然,我再说最后一个前提:目前除了程序员,其实大部分人用 gpt5.5 和豆包千问元宝没太大差。
大部分人的工作和计算机不沾边(包括坐办公室的很多文员职业),有这时间,还不如多思考一下商业业务等…. 别搞错了努力对象。因为使用上国外的先进模型,是有极高的技术门槛的,会浪费巨量时间,折腾各种歪门邪道,最后一上,一个 Hello 就没后续了,基本以失望结尾。国内 AI 完全足够。
MenuGen 完整案例(Karpathy 红杉 2026 峰会核心例子)#
1. 他做了什么(传统 AI 应用)#
Karpathy 用 Vibe Coding(氛围编程) 开发了一款叫 MenuGen 的网页应用,解决一个真实痛点:
去国外餐厅,菜单只有文字、没有菜品图,看不懂菜是什么。
流程:用户拍菜单照片 → OCR 识别菜名 → 调用文生图生成菜品图 → 重新排版渲染成带图菜单 → 前端展示、部署上线、加支付 / 认证等完整产品链路。
这是典型软件 2.0 思路:用多层工程链路、多个 AI 模型串联,搭一套完整应用。
2. 模型原生能力直接 “吞掉” 它(软件 3.0)#
后来他发现 Gemini(多模态大模型 + Nano Banana 图像编辑能力) 可以一步完成:
直接上传菜单原图,给一句提示词:
“把对应菜品的图片,直接叠加在这张菜单的菜名位置上。”
模型直接输出一张修改后的菜单原图:菜名旁精准 P 上菜品图,OCR、图片生成、排版、渲染全流程被跳过,不需要 App、不需要后端、不需要前端、不需要部署。
3. Karpathy 的核心顿悟#
他原话:
我整个 MenuGen 应用都是多余的,它根本不该存在。
不是 AI 让这类应用开发得更快,而是大模型原生多模态能力,直接消解了这类应用的存在意义—— 原本需要一整套软件工程实现的功能,变成模型一次端到端生成,中间所有软件层全部消失。
简单说:很多 AI 应用不是加速版传统软件,而是会被大模型原生能力直接替代、蒸发。
要不要我帮你整理成一段可直接转述的精简版?