近日,高德与千问应用团队联合发布AGenUI,这是行业首个覆盖iOS、Android、HarmonyOS三端原生的端云一体A2UI开源框架。
AGenUI 基于GoogleA2UI最新开放协议,以跨平台C++ Core为核心,面向AI Agent提供从模型生成、协议表达、端侧原生渲染、流式增量更新,到事件回流与多端一致性的完整能力,帮助开发者以更低成本构建高性能、可交互、可规模化落地的生成式UI体验。
这也标志着双方将在生成式UI、AI Agent交互基础设施与开放协议生态方向持续共建,共同推动A2UI从开放标准走向规模化落地。

大模型正在推动应用形态从“人适应软件”走向“软件理解人”。在AI原生应用中,用户不再只是沿着固定页面和预设流程完成操作,UI不再只是静态页面,而需要成为Agent实时表达、组织和执行任务的动态载体。因此,应用的交互形态正在从传统固定UI、文本回答和Markdown展示,升级为结构化、可交互、可动态生成的生成式UI。
生成式UI的规模化落地,需要同时解决两类基础问题:一是协议层,即模型如何以低成本、稳定、可控的方式描述UI;二是渲染层,即端侧如何将模型生成的UI描述转化为高性能、可交互、跨端一致的原生界面。
Google A2UI开放协议定义了模型描述UI的标准方式,AGenUI则进一步补齐端侧原生渲染引擎能力。基于A2UI,AGenUI将模型生成的界面意图渲染为iOS、Android、HarmonyOS原生组件,连接模型、Agent与终端体验,让AI应用从“文本式交互”走向“生成式UI交互”。

AGenUI开源了两部分能力:云侧生成能力与端侧渲染能力。
-
云侧 AGenUI Agent Skill:Agents可以通过AGenUI Agent Skill生成符合A2UI协议的JSON。A2UI JSON是端侧渲染的数据源,也是一种面向大模型友好的UI表达方式。Skill沉淀的是“如何按照A2UI描述卡片和页面”的能力,可以被复用、精调和持续优化。
-
端侧AGenUI Client SDK:Client SDK接收A2UI JSON,并在iOS、Android、HarmonyOS的原生控件体系上完成协议解析、布局计算、流式增量渲染与事件回流。三端共用同一套C++ Core,既保障核心逻辑一致,也最大限度复用跨端能力。
AGenUI将Agent的动态生成能力与终端的原生体验连接起来,并以A2UI协议为纽带,形成标准化、可扩展、可流式的端云一体链路。
① AI 原生协议,标准开放
AGenUI完整实现Google A2UI v0.9开放协议。任何符合A2UI协议的模型输出,都可以被AGenUI渲染;任何遵循A2UI的Agent,也可以接入这套端侧能力。
A2UI采用AI原生的协议设计,具备语义化组件、结构化表达、UI与数据分离、流式友好等特征。相比直接生成HTML或复杂私有DSL,A2UI更适合大模型稳定生成,能够降低 token成本、提升生成速度,并减少生成结果的不确定性。
AGenUI在对齐开放标准的基础上,进一步补齐了移动端原生渲染、跨端一致性、性能保障和工程化接入能力,为A2UI在真实App场景中的规模化落地提供基础设施支撑。
② 高性能Native组件&C++ 异步渲染核心

AGenUI采用纯Native渲染路线:生成式UI最终以系统原生组件的形式呈现,可以自然融入宿主App的交互、动画、无障碍、手势和调试体系。在复杂页面滚动、长列表、流式追加等核心场景中,AGenUI以原生渲染能力保障流畅稳定的用户体验,目标对齐高刷设备下的120fps水准。
这一能力背后,AGenUI通过三层性能机制,系统性优化生成式UI场景下的实时性、稳定性与流畅度:
-
Streaming-first:其核心架构采用Streaming-first设计:组件到达即可挂载,文本到达即可追加,数据到达即可绑定。首屏体验不再等待完整页面生成完成,而是让生成过程本身成为用户可感知的界面呈现过程。
-
差分更新:AGenUI在C++ Core中实现差分更新机制,对流式生成过程中的 UI 树变化进行最小化更新。对于长页面、深层嵌套和持续追加的生成式 UI 场景,端侧只更新变化节点,而不是整页重建。
-
异步渲染:协议解析、状态管理、Yoga布局计算和节点Diff等核心逻辑均在独立线程中完成,主线程只负责提交轻量级 UI 操作,从而降低复杂JSON、深层嵌套和高频增量更新对交互流畅度的影响。
在平台适配层,AGenUI也针对各端原生能力进行深度优化。以HarmonyOS为例,AGenUI基于ArkUI原生组件体系,并通过C API打通高性能渲染链路,进一步降低跨语言调用与组件操作开销,保障复杂生成式UI在鸿蒙端的流畅体验。
③ 跨端代码复用,多端一致性

移动端生成式UI最大的工程挑战之一,是多端一致性。如果iOS、Android、HarmonyOS各自实现一套协议解析、布局计算和状态管理逻辑,长期维护成本高,视觉和交互也容易产生差异。
AGenUI通过架构解题,以跨平台C++ Core统一承载协议解析、状态管理、Yoga布局计算、节点Diff与事件分发等核心逻辑,iOS、Android、HarmonyOS 分别通过 Objective-C++、JNI、NAPI接入同一套内核,最终渲染仍由UIView、Android View、ArkUI等平台原生能力完成,兼顾跨端一致性与原生体验。
④ 渲染效果丰富,Styles体系完善

生成式UI不只是“能画出来”,更要“画得好、画得稳、画得符合品牌”。
AGenUI在对齐A2UI标准协议的基础上,建立了完整的样式与主题体系,覆盖颜色、字体、圆角/间距/阴影、布局、日夜间模式、RTL国际化等关键视觉要素,帮助开发者以更低成本获得高质量的生成式 UI 呈现。
目前AGenUI内置22个组件,包括A2UI协议组件与SDK扩展组件,并支持45+ CSS样式属性。开发者可以通过Theme Configuration统一管理品牌规范、设计语言与多端适配规则。
在云侧,AGenUI Agent Skill将“按A2UI生成卡片或页面”的能力沉淀为可复用资产。配合UI与数据分离、主题系统和组件复用机制,模型无需每次重复生成完整视觉细节,而是可以通过语义化描述与主题映射完成高质量UI生成,从而降低token成本、提升生成稳定性,并让输出结果更接近设计规范。
⑤ 全面可扩展可定制:组件、FunctionCall、主题

AGenUI不仅提供内置组件,也提供完整的三维扩展定制能力,方便业务接入自己的原生能力。
-
UI组件扩展:开发者可以将自定义Native View注册为AGenUI组件。注册后,自定义组件即可像内置组件一样被模型引用,参与流式渲染、数据绑定、事件回流和生命周期管理。
-
FunctionCall扩展:Function机制同样采用统一设计。按钮动作、输入校验、字符串插值、事件回流等能力都可以通过统一路径注册和调用,避免内置组件与业务组件之间出现割裂。
-
主题定制:AGenUI为生成式UI场景专门设计了完善的Theme系统,并支持Design Token。模型只需输出语义化UI描述,端侧即可基于Theme将其映射为颜色、字体、圆角、间距、阴影等具体视觉参数,减少模型对视觉细节的重复生成。不仅提升输出稳定性与token利用效率,还能让同一份Agent输出在不同App、品牌和终端形态下保持结构稳定,并呈现差异化视觉风格。
⑥ 极简接入,分钟级上手
AGenUI将开发者接入效率作为核心设计目标之一,提供端侧 SDK、云侧Agent Skill与仓库内置Playground,覆盖从效果体验、协议调试到工程集成的完整路径。
端侧 SDK 提供统一API,三端接入逻辑保持高度一致。支持iOS 13+、Android API 21+、HarmonyOS NEXT API 20+。通过统一入口SurfaceManager,开发者仅需少量代码即可创建A2UI渲染容器、加载A2UI JSON、监听事件回流,并快速跑通第一个生成式UI页面。
云侧AGenUI Agent Skill面向Agent工作流设计,可将业务意图、上下文信息与结构化数据组织为符合A2UI协议的UI描述,帮助开发者快速构建从Agent生成到端侧Native渲染的闭环链路。
此外,AGenUI在开源仓库中提供Playground。开发者可以基于示例工程快速体验A2UI JSON的生成、预览与调试流程,理解协议结构、组件能力和生成式UI的端云协同方式,再进入实际业务集成。
基于上述基础设施能力,双方完成了生成式UI链路 Demo 验证,展示AGenUI从A2UI生成、端侧原生渲染、流式更新到事件回流的完整闭环,并进一步探索其在真实应用场景中的落地上线。
高德长期深耕地图导航、空间智能、位置服务与实时复杂出行服务,积累了大量复杂真实世界交互和多设备协同的场景和技术优势;千问应用团队面向大规模AI应用入口,在Agentic交互、AI应用体验、场景化落地与开发者生态建设方面具备丰富实践。此次双方围绕AGenUI联合发布,希望将高复杂度场景中的端侧工程能力,与AI应用侧的交互探索和生态实践结合起来,为开发者提供更完整、更易用的生成式UI基础设施。
随着AGenUI正式开源,我们期待更多开发者和生态伙伴基于AGenUI参与共建:一起完善组件体系、扩展端侧能力、沉淀Agentic UI最佳实践,探索生成式UI在更多应用和终端场景中的可能性。
-
官网:https://genui.amap.com
-
GitHub开源仓:https://github.com/AGenUI/AGenUI
欢迎访问官网查看AGenUI的效果示例,在GitHub关注开源仓库,一起探索生成式UI的更多可能。
END


