游戏百科

Gemini 3.0还在预热,中国AI抢先!30秒造APP全网首测

新智元报道

[新智元导读]Gemini3.0还未杀到,一系列惊艳实测就已宣告:AI「生成涌现」时代,真的来了!几乎同一时间,国内一款新生AI神器,竟将这股超能力塞进手机,30秒手搓一个APP。

2025年终AI压轴大戏,本周强势来袭!

这几天,谷歌下一代AI模型预热引爆全网,Gemini3.0「全家桶」多款模型蓄势待发。

此时此刻,全网都在坐等这场王炸发布。

毕竟,OpenAIGPT-5.1小修小补,并未触发所有人的G点。如今,Gemini3.0几乎成为「全村人」的希望。

社交媒体上,更多的惊艳实测demo曝光:一句话即生前端UI、操作系统界面,以及复杂的SVG动画等等。

左右滑动查看

在这热闹喧嚣之中,我们看到了——AI的下一个未来,是「生成涌现」。

当前,AI正经历一场深刻的范式转变,从单一模态如文本/图像的生成,逐步演进至「生成涌现」的新阶段。

在这一全新范式下,Gemini3.0正作为引领者,驱动着无限概念的生成与实现。

恰在今天,蚂蚁灵光正式上线,一款集闪应用、对话、开眼于一体的全模态通用AI助手。

它的诞生,打开了「生成涌现」的另一种方式。

AI进入「生成涌现」时代

生成涌现,本质上是AI生成能力的「爆炸式扩展」。

提到「涌现」一词,我们并不陌生。2022年,谷歌DeepMind斯坦福等在一篇论文中验证了:

随着模型的参数规模扩大,性能也会随之提升,还能解锁不可预测的全新能力。

他们将其称之为,「大模型涌现」。它从新的维度,再次印证了ScalingLaw不死。

而这里的「生成涌现」,不在于内容本身,而在于前端与系统设计更高层次的应用重塑。

ChatGPT诞生后很长一段时间,传统生成式AI更擅长「线性输出」:prompt输入,文本/图片等单一模态输出。

这种以单一模态的输出,在2025年迎来一个新的拐点。

这一年,我们已见证了太多标志性大事件——

原生多模态模型:Gemini2.5、GPT-5、Grok4等最具代表性

图像模型:GPT-4o掀起吉卜力热狂潮;NanoBanana引爆AI图像编辑的热潮

视频模型:Veo3首次实现音画同步;Sora2坐享创意领域的ChatGPT时刻

世界模型:李飞飞Marble一句话即生3D世界;谷歌Genie3直出可交互环境

左右滑动查看

前沿模型的每一次进化,都在向着原生多模态方向演进,最终导向了「涌现式生成」。

也就是说,AI会像生态系统般,逐渐具备自主扩展能力,并融合多模态、实时编码、动态应用的生成。

当参数超越更大的阈值时,模型不再局限于线性预测,而会涌现出「系统级」的能力。

这种趋势,在尚未真正露面的Gemini3.0身上,愈发明显。

一句指令,它便能一次性构建可用的Windows、macOS操作系统,一键克隆YouTube网站视频可看、可交互小游戏......

Karpathy调侃道,Gemini3.0在你没开口就能读懂人类心思,甚至,还能和你的猫聊天

Gemini3.0还把AI编码上限推到一个全新高度,语言一键迁移,复杂的前端UI交互。

这种生成涌现的爆发力,就连「股神」巴菲特也为之动容。

可以笃定的是,未来AI的发展方向,或说下一个趋势,便是朝着「生成涌现」这一范式演进。

要说生成,其能力边界可以大到所有人无法想象,但最终落地时会是怎样的一种形态?

同一时间点上,蚂蚁灵光的登场,给业界提供了一条可行的路径。

从模型层面上看,Gemini3.0可以验证系统、前端设计无限生成。但从产品层面看,灵光正开启「生成涌现」普惠化的探索。

一个人人皆可在移动端,短短30秒内,一键创建日常小应用的神器。

灵光真正实现了「人人手搓AI」的梦想,完美诠释了「生成涌现」的落地。

灵光一闪,人人进入生成时代

在这个人人皆可生成的时代,最不缺的就是「半成品」。

尤其在当下,氛围编程、生成式音乐、生成式网页、生成式视频...似乎一切皆可由AI完成。

所有人都在疯狂地「玩面粉」,但很多AI生成的内容都是半成品,或者压根不可用。

可人们真正想要的,从来不是面粉、面团等,而是可以直接端上桌的馒头、包子,甚至是要「好看又好吃」的那种。

这正是,灵光诞生的契机。

不管是打工人,还是学生,不管是老板,还是普通人,皆需要一个既能生成「最终好用产品」的AI工具,而且生成的内容还要「好看」。

左右滑动查看

你需要什么,就去造

灵光里最强大的一个功能就是闪应用。

在对比了众多国内外的通用AI产品后,灵光称得上国内通用AI助手里的一股清流,甚至可以说是独特的一种存在。

灵光使用下来,给人一种,这是通用AI产品中的「iPhone」。

iPhone好用在于它开创了「AppStore」,定义了「下载应用」的时代,将手机从「通信工具」变成了「万能掌上电脑」。

而灵光正在用「灵光闪应用」开启下一个时代:从下载海量应用进化为即时生成专属应用。

这是一种范式革命,它用30秒的「即时生成」取代了「搜索、筛选、下载、安装」的漫长链路,把创作权交给了普通人。

这个30秒的应用生成速度,体验真香。

比如制作一个能够分享,能够解释清楚最近网络热梗「哈基米南北绿豆」的来龙去脉。

可以看到,闪应用不止于「静态展示」,更拥有强大的「动态交互」能力。

这是因为,每个轻量级应用都可直接调用大模型等后端能力,不仅能展示结果,更能实时与外部进行交互。

这些应用真的就和APP一样,在你的闪应用列表中,随时可以调用。

不管是运动健⾝、旅⾏规划,还是健康⻝谱、理财规划,或者购物决策,这里全靠发挥你的想象力!

当Cursor为首的编程IDE让普通人离AI越来越远时,当氛围编程只属于部分懂技术的「特权」时。

其实从这次Gemini3的「路透」就能看出来,未来所有的产品都能「AI生成」,而且也必将AI生成。

AI会不断吞噬掉所有工作内容。

于是,灵光也做了一次「减法」。

他们用「信息美学」的方式,让灵光的界面做到了极简。

它不再让你从纷繁的多模态工具中进行选择,而是一次性「生成」一切。

用「信息美学」融合全模态

简单来说,信息美学就是让信息变得既「好看」又「好懂」的艺术!

在AI时代,我们被卷入信息的洪流。

从社交媒体,到新闻、报告充斥着冗余的内容,其中大量还是AI生成的同质化、低价值的,让获取真实价值的信息变得愈发困难。

所以AI时代最大问题并不是获取知识,而是如何更好的组织知识,从繁杂的信息海洋中捞到真正的珍珠。

一个有用的信息不应该是深藏不露的或者长篇大论的,而应当是「恰到好处」。

比如虽然ChatGPT、Gemini等目前基础功能都很强大,但是每次问题都要输出一篇千字长文,让关键信息淹没在长上下文里。

或许,在底层模型卷无可卷的当下,我们需要一种新的AI产品形态。

全模态通⽤AI助⼿灵光,就是一个能把信息变成艺术品的AI工具。

它不仅仅是把知识内容和信息结构做得非常漂亮,而是提供了一种设计哲学,认为「美」本身就是一种功能。

它通过视觉、听觉甚至触觉(如3D交互)来组织信息,让你在接收信息的过程中感到愉悦、高效,并且能「秒懂」。

接触信息,感到愉悦,是的,这就是想象中,通用智能的那种感觉。

你没有看错,你甚至可以在灵光中创造3D模型,这已经脱离了一个对话AI的层面。

这一能力的实现,是因为灵光构建了「多智能体协作的Agentic架构」,让生成不再是单一工具的线性操作。

在生成可视化内容时,它会调度图像、3D、动画等不同领域的专业AI智能体,让其实时协作,提供更完整、更丰富、更沉浸的视图体验。

更值得一提的是,这一切皆可在移动端就能实现,在业界实属罕见。

总结来说,灵光带了一次内容生成的革新:它是首个实现了基于全代码生成的多模态内容输出。

当提出一个问题,它不只是「回答」,它会自动理解真实意图,并立即以代码为核心,实时构建出结构化、个性化,且高度美观可交互的可视化内容。

开眼:探索未来AI的产品形态

更令人欣喜的是,灵光这次探索了一种新的AI形态,摄像头+AI。

灵光开眼,这次让AI睁眼看世界。

虽然手机摄像头的参数已经卷到天际,但它还是一个死物,只负责记录。

而在AI加持下,未来的摄像头,可以说是「具身智能」史前时代的最佳载体。

灵光开眼的识别成功率和速度很难让人相信。

灵光开眼能够准确识别生活中的几乎任何物体。

甚至你还可以用灵光开眼来「找不同」,识别中容易被混淆的对象。

甚至可以用灵光总结了2025年9月份的阿里财报,还顺便算出了同比(有点东西)。

再让它解读一篇论文,看看能否胜任?

打开Transformer经典之作,灵光一眼识别出这篇论文,并在接下来回答中,关于论文主旨、架构性能,全部给出了正确的解析。

让普通人提前进入未来世界

如今,生成式AI发展的问题已经不是「生成」,而是AI的天花板到底有多高?

未来是不是,任何作品、任何工作内容、任何创作都可以由AI生成?

AI在发生大的变化,生成式也在发生大的变化,谷歌的Gemini3预示着未来一种全新的趋势。

很多提前体验到Gemini3的用户都认为,新模型在美学与信息量之间找到了前所未有的平衡。

文字更有审美密度,结构更清晰,内容更饱满,同时生成失误率大幅降低。这种一致性,正与灵光的方向不谋而合。

灵光的核心不是炫技,而是把高级能力包装成人人都能用的体验。

当模型本身的审美能力、稳定性和知识密度提升后,灵光就能把这些底层优势转译成更可靠的场景输出:

可以说,Gemini3的出现,让灵光一直坚持的方向被再次证明。

灵光要做的,就是把「好」变得可感,把「稳」变得可依赖,让每一个普通用户都能享受到这场升级,而不需要成为提示词专家。

这里再次引用大神卡帕西对于Gemini3的评价。

当一个AI在你提问前就猜到了你的想法,并且还给你答案,相信我们离真正的AGI世界不会太远。

灵光不追求一口气摸到天花板,而是先把地板垫高。

把复杂性藏起来,把确定性交给用户,让第一次用AI的普通人也能稳稳落地。

让更多人走进来,提前感受到未来的AI世界。

千问APP携带阿里「公司级」战略的雷霆之势转向C端。

意味着AI从「技术展示」走向「结果交付」:普通人也能随手可得。

灵光想做的,就是让这个复杂的AI时代,变得更简单一些~

秒追ASI⭐点赞、转发、在看一键三连⭐点亮星标,锁定新智元极速推送!