游戏百科

田渊栋卡帕西力荐Nano Banana:论文变漫画、手写解题以假乱真

西风 发自 凹非寺 量子位 | 公众号 QbitAI Nano Banana Pro又被开发出了新玩法。 AI大牛田渊栋

西风 发自 凹非寺

量子位 | 公众号 QbitAI

Nano Banana Pro又被开发出了新玩法。

AI大牛田渊栋强烈安利,用整合了Nano Banana Pro生图能力的NotebookLM,硬生生把论文变成了漫画。

效果be like:

其本人直呼这宣传海报比他自己做的好多了。

确实比直接看论文有趣易懂。

谷歌自己人可能都没想到这种打开方式,只是一味地“真不错”。

评论区更是一片求提示词的声音。

NotebookLM的产品负责人都被炸了出来,回应会尽快优化,让其分享和导出更丝滑。

除此之外,这几天网友还解锁了更多新玩法。

Nano Banana解题字迹像真人亲笔

特斯拉前AI总监、OpenAI创始成员Andrej Karpathy(卡帕西)分享用Nano Banana Pro解题也火了。

不管是随手画的草稿,还是各类示意图,它全都能精准识别。

而且输出的解题字迹还真像是真人手写的:

ChatGPT核验后认为Nano Banana手写的这些解法基本全对,只有两处小瑕疵:

一是Se₂P₂应为二硒化二磷,原文未标注规范命名;二是拼写错误,“thiocyanic acid”(硫氰酸)被误写为“thoicyanic”。

在卡帕西看来,现在用文本和大模型对话,就像在敲DOS命令行,图形界面(GUI)还没被发明出来一样,而“智能画布”这种可视化、可直接操作的交互方式,才是大模型未来该有的GUI。

没过几个小时,他又发了一条推文,用Nano Banana Pro定制了每周撸铁计划,还直接生成了可打印的海报。

每天该练啥,一抬头就能看到~周二看起来强度爆表,毕竟我特意要求要爷们儿一点。

以及暗戳戳说了句:不好意思,接下来不刷屏发Nano Banana Pro的相关内容啦。

有网友在玩的过程中还发现,给Nano Banana看一道手写的题,它还会模仿真人笔迹,笔记本的版式各方面的质感都高度还原:

这谁还能分清是不是AI生成的。

还别说,真有人怀疑这就是发帖者手写的。

随后卡帕西验证后表示Nano Banana的确能做到,prompt是起始图片+“解决这道数学题,然后用我的手写字体生成更新后的图片”。

我们截图发给Gemini,Gemini也说是AI生成的,仔细看其笔迹过于完美,每个数字“2”的写法几乎完全一样。

芝士终于在它该在的地方了

凭借Gemini、Nano Banana的强势升级,谷歌这次在AI赛道直接鲨疯了,不仅股价创下历史新高,市值还成功超越微软,妥妥的王者归来。

就在这几天,谷歌CEO劈柴哥还让一个8年老梗圆满了。

2017年,谷歌为安卓手机推出了一个芝士汉堡emoji,把芝士放在了肉饼下面,被眼尖吃货注意到,引发网友群嘲。

劈柴哥当年半开玩笑地道歉,调侃谷歌要“放下所有工作”解决芝士汉堡emoji的错误结构。后来在Android 8.1系统中,谷歌把emoji修正为芝士在肉饼上的版本。

如今劈柴哥再度发推,发了一张Nano Banana Pro拆解汉堡结构的示意图,配文“你懂的”:

图中清晰标注,芝士片必须放在肉饼上面,这样才能正常融化,完美呼应8年前的emoji乌龙,算是把这个陈年梗圆明白了。

马斯克评论区发emoji,大有多年前射出的箭,如今正中眉心的意思。

这看似只是芝士放对地方的小进步,背后却是这么多年AI技术质的飞跃,它意味着AI已经能理解物理世界的逻辑,精准处理物体相对位置、进行空间定位。

正如科技投资人、Coinbase前CTO Balaji Srinivasan所言:

谷歌是真的押上了全部资源深耕AI,而Gemini 3的发布,标志着他们正式夺回了领先地位,至少目前是这样。

参考链接:[1]https://www.businessinsider.com/sundar-pichai-cheeseburger-google-comeback-2025-11[2]https://x.com/karpathy/status/1992655330002817095[3]https://x.com/tydsh/status/1992440158839550330?s=20[4]https://x.com/immasiddx/status/1991918223454003346

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态