当前位置：首页 > 大模型评测 > 正文内容

30秒做应用、实时写图文，「灵光」想用AI重塑创造力边界

上善若水3个月前 (11-18)大模型评测

在人工智能大模型领域，竞争的焦点已经悄然发生了转移，不再仅仅局限于谁的模型在基准测试中得分更高。

随着“灵光”（Lingguang）的发布，行业趋势正从“谁的模型更强”转向**“谁能将能力更好地转化为用户体验”**。

灵光通过一系列创新性的交互和生成能力，打破了传统的“提问—回答”路径，将语言本身变成了生产力的触发器和工具的起点。

本文将深入剖析“灵光”在信息美学、即时应用生成和流式视觉互动这三大核心维度的突破，展现其如何实现从实验室语言到用户日常“动词”的跃迁。

一、从回答到“表达”：信息美学与结构化输出

传统的AI模型往往以一段纯文本作为终点，而灵光则将信息输出视为一种交互式的“表达”。它通过融入“信息美学”的理念，让复杂信息的吸收变得更直观、更有效率。

1. 交互式内容生成：让信息“动起来”

灵光的能力超越了简单的文本返回，它能实时生成可交互、可操作的内容组件：

• 实时 3D 模型：当用户查询地标信息（如广州塔）时，灵光不仅提供文字介绍，还能实时生成一个可旋转、可缩放的 3D 模型，提供身临其境的直观感受。

• 可缩放交互地图：在规划美食打卡路线时，模型会直接生成一个可交互的地图组件，用户可以在对话窗口内直接缩放、移动和查看路线详情。

2. 结构化、逻辑化的专家级输出

面对复杂或多层次的问题，灵光展现出强大的信息深度理解和再组织能力，输出具备专家型写作者内容组织方式的卡片式风格：

• 卡片式逻辑结构：输出内容通常采用“标题+概括+要点”的结构化卡片格式，逻辑清晰，节奏舒适，避免了冗长的“文字墙”。

• 底层技术支撑：这种能力是通过一套以代码生成为核心的内容创建流程实现的。它依赖多个智能体（如图像生成、布局设计、数据调取代理）的协作，动态生成代码、样式和组件，从而实现个性化且美观高效的信息展示。

二、从对话到“动手”：一句话生成 App（闪应用）

“灵光”最引人注目的能力之一，便是将自然语言描述直接转化为即刻可用的工具，即“闪应用”。这是一种最接近“魔法”的生产力体验，彻底打破了传统软件开发的门槛。

1. 一句话生成工具的逻辑闭环

用户只需用一句自然语言描述其需求，例如“帮我做一个长文本拆分工具”或“我需要一个可以拍摄后实时翻译菜单的工具”，灵光就能在约 30 秒内完成App的生成。

• 即时可用性：生成的闪应用并非一个简单的原型（Demo），而是具备完整的逻辑闭环，能够调用大模型的后端推理能力，实现与用户的实时互动和响应。

• 降低创造门槛：这项能力将原本需要具备代码、设计和产品逻辑的专业人士才能完成的“创造”行为，交还给了普通用户。语言本身成为了生产力的触发器和工具的起点。

2. 技术定位：语言驱动的工具生成

这一机制的本质是利用大模型的超强代码生成和推理能力，将用户对需求的自然语言抽象，直接映射为具备前后端逻辑的、可执行的代码组件，并将其嵌入到当前的对话流中，实现了“边说边做”的无缝体验。

三、从文字到“视觉”：带着“眼睛”展开互动（开眼）

通过引入“开眼”功能，灵光赋予了AI Agent流式的视觉感知能力，将摄像头捕获的画面作为另一种自然语言输入，从而展开更连贯的互动。

1. 流式视觉识别与连贯行为链条

灵光的能力超越了传统AI的静态图像识别。当用户打开摄像头对准一个物体（如一杯奶茶）时：

• 流式识别：模型能实时、流式地识别出物体及其状态。

• 主动跟进与延展对话：它不会仅仅停留在“这是奶茶”的识别结果，而是会主动发起跟进动作，如提供基于这杯奶茶的饮食建议（如含糖量分析）、保存注意事项或同品牌其他口味推荐。

2. 深入理解用户意图

这种交互的突破在于，灵光不再满足于简单的“物体识别”，而是试图理解用户为什么在看它、以及用户下一步可能需要什么样的帮助。它将一次视觉识别变成了一套连贯的行为链条。摄像头不再仅仅是输入图像的工具，而是通过视觉引导交互的、富有洞察力的对话渠道。

总结性意义

“灵光”的发布，是AI行业从技术堆砌转向用户中心体验设计的标志性事件。它成功地将AI大模型的强大能力，以交互式美学、即时工具化和流式视觉互动的形式，转化为了用户日常的“动词”。

它打破了“提问—回答—再动手”的传统僵硬路径，通过“闪应用”和“开眼”等功能，真正实现了语言即生产力，对话即创造的全新人机交互范式，为AI Agent的未来发展方向提供了极具启发性的思路。

返回列表

上一篇：Gemini 3.0 Pro模型卡曝光，多模态、知识库能力大幅超越GPT与Claude

下一篇：谷歌杀回来了！Gemini 3 全面碾压 GPT-5.1，AI 霸主正式归位

“30秒做应用、实时写图文，「灵光」想用AI重塑创造力边界” 的相关文章

灵芽AI博客

30秒做应用、实时写图文，「灵光」想用AI重塑创造力边界

一、从回答到“表达”：信息美学与结构化输出

1. 交互式内容生成：让信息“动起来”

2. 结构化、逻辑化的专家级输出

二、从对话到“动手”：一句话生成 App（闪应用）

1. 一句话生成工具的逻辑闭环

2. 技术定位：语言驱动的工具生成

三、从文字到“视觉”：带着“眼睛”展开互动（开眼）

1. 流式视觉识别与连贯行为链条

2. 深入理解用户意图

总结性意义

“30秒做应用、实时写图文，「灵光」想用AI重塑创造力边界” 的相关文章

程序员不再写代码，而是靠「感觉」！年度热词Vibe Coding背后的编程革命

AI行业沸点：百度登顶、OpenAI出招、Meta革新、Inception融资——全球AI格局全面重构

马斯克新模型屠榜，包揽前二！马斯克：已经没有真正能考AI的测试题了，终极测试是现实世界

谷歌杀回来了！Gemini 3 全面碾压 GPT-5.1，AI 霸主正式归位

谷歌深夜炸场！Gemini 3震撼发布：博士级推理吊打前代，OpenAI奥特曼点赞

灵芽AI博客

30秒做应用、实时写图文，「灵光」想用AI重塑创造力边界

一、 从回答到“表达”：信息美学与结构化输出

1. 交互式内容生成：让信息“动起来”

2. 结构化、逻辑化的专家级输出

二、 从对话到“动手”：一句话生成 App（闪应用）

1. 一句话生成工具的逻辑闭环

2. 技术定位：语言驱动的工具生成

三、 从文字到“视觉”：带着“眼睛”展开互动（开眼）

1. 流式视觉识别与连贯行为链条

2. 深入理解用户意图

总结性意义

“30秒做应用、实时写图文，「灵光」想用AI重塑创造力边界” 的相关文章

程序员不再写代码，而是靠「感觉」！年度热词Vibe Coding背后的编程革命

AI行业沸点：百度登顶、OpenAI出招、Meta革新、Inception融资——全球AI格局全面重构

马斯克新模型屠榜，包揽前二！马斯克：已经没有真正能考AI的测试题了，终极测试是现实世界

谷歌杀回来了！Gemini 3 全面碾压 GPT-5.1，AI 霸主正式归位

谷歌深夜炸场！Gemini 3震撼发布：博士级推理吊打前代，OpenAI奥特曼点赞

一、从回答到“表达”：信息美学与结构化输出

二、从对话到“动手”：一句话生成 App（闪应用）

三、从文字到“视觉”：带着“眼睛”展开互动（开眼）