AI 做 PPT,最后全输在了审美上。这个 Skill 把这条路走通了

你跟 AI 说”做一个产品发布 PPT”,它洋洋洒洒写了几千字内容。打开一看,排版稀烂,配色诡异,动画闪得眼睛疼。换一个 AI 工具再试,内容靠谱了,排版又回到 2003 年 PowerPoint 艺术字的水准。

这不是模型智商的问题。模型能写出好内容,但它缺一套受约束的设计系统。你让它”设计得好看一点”,它理解的”好看”跟你脑子里想要的,中间隔了十万八千个像素。

lewislulu 开源的 html-ppt-skill 把这个问题切开了一个口子。它不生成 PPTX,输出的是纯静态 HTML 演示文稿。浏览器打开,方向键翻页,F 全屏,直接投屏演示。但它跟其他”网页版 PPT”工具的核心差异,在于它把排版和审美封装进了一套完整的素材库,36 套预置主题,31 种页面布局,15 套完整模板,AI 做的事不是”设计”,而是从这套库里组装出结构正确的页面。

说白了,这篇文章想讲清楚的只有一件事:为什么”让 AI 做 PPT”这件事,问题不在 AI 不够聪明,在于它缺了一套能调用的设计语言。html-ppt-skill 的思路是把这块补齐了,而且补得相当有谱。

环境准备

安装比大部分同类工具简单。html-ppt-skill 面向的是支持 AgentSkill 协议的环境,WorkBuddy、Claude Code、Codex、Cursor、OpenClaw 都能用。不需要单独注册账号,不需要申请 API Key,MIT 协议开源。

npx skills add https://github.com/lewislulu/html-ppt-skill

前端依赖只有一个 Node.js。LTS 版本就行,没有额外的运行时要求。跟很多需要配 Python 环境、装字体库、拉 Docker 镜像的工具比,这个门槛可以说是零。

AI 做 PPT,最后全输在了审美上。这个 Skill 把这条路走通了

装完验证也很直接。对 AI 说一句”做一份 3 页的测试 PPT,用 minimal-white 主题”,能正常生成 HTML 文件并在浏览器中播放,环境就算就绪了。如果这一步卡住,大概率是 Node 版本太老,升级到 18+ 就能解决。实测过程中有人反馈 Windows 终端编码问题,切换成 UTF-8 后也顺利通过。

操作流程

整个使用流程可以拆成四步:描述需求,Skill 确认方案,自动生成 HTML,浏览器演示。每一步都踩在明确的设计意图上。

首先是描述。跟 AI 说的话越具体,输出越精准。“做一份 8 页的技术分享 PPT”和”做一份 8 页微服务架构技术分享 PPT,暗色主题,要有架构图和代码示例”,后者明显更能吃到 Skill 的完整能力。主题名可以直接从 36 套里选,cyberpunk-neon 做技术分享有粒子特效和霓虹动画,sunset-warm 做产品发布有落日暖色调,xiaohongshu-white 做小红书风格图文有白底柔和风。每种场景都有精确匹配的主题,不是”深色/浅色”这种粗粒度选择。

第二步,Skill 会主动确认受众、风格偏好和内容布局。它不是那种”请选择以下选项 1/2/3″的死板交互,更像是”你这次是给技术团队讲还是给投资方讲?风格偏暗黑还是偏清爽?”顺着回答就行。这步的体验比大部分同类工具好,因为它不是在收集参数,是在帮你把模糊的需求变得具体。确认完方案后再生成,返工率明显降低。

第三步,生成。速度取决于内容量和模型,通常几十秒到一两分钟。输出的是一个文件夹,里面有 index.html 和所有资源文件。双击 index.html,浏览器里直接播放。不依赖任何服务器,不需要构建步骤,纯静态。

第四步,演示。键盘操作:方向键翻页,F 全屏,O 全局预览网格,T 循环切换主题。最关键的是按 S 键,弹出一个独立的演讲者窗口,四张可拖拽的磁性卡片,当前页预览加下一页预览加逐字稿提词器加计时器,两个窗口通过 BroadcastChannel 实时同步。对需要上台讲 PPT 的人来说,这是实打实的加分项,不是噱头。

AI 做 PPT,最后全输在了审美上。这个 Skill 把这条路走通了

关键设计

html-ppt-skill 的设计思路一句话就能说清楚:把 PPT 排版的复杂度交给预置设计系统,把内容创作交给 AI,把组装逻辑交给 Skill。三层分工明确。

36 套主题的实现方式值得单独拎出来讲。每套主题不是一套完整的 CSS 框架,而是一份纯 CSS token 文件。换主题就是换一行 <link> 标签。这个设计让”一键换肤”成为真正的”一键”,不是重新生成,不是重新渲染,就是在运行时切换 CSS 变量。

minimal-white 的干净白底、cyberpunk-neon 的霓虹粒子画布、tokyo-night 的暗色代码风,切换代价几乎为零。47 个动效也用了类似的分层设计,27 个 CSS 动画管轻量过渡,20 个 Canvas 特效管影院级视觉,两层互不干扰,按需叠加。

AI 做 PPT,最后全输在了审美上。这个 Skill 把这条路走通了

演讲者模式的架构也有意思。它不是一个内嵌面板,而是一个独立的浏览器窗口。通过 BroadcastChannel API 跟主演示窗口保持同步,翻页、换主题、加注释,两侧实时联动。这意味着演讲者可以在副屏上看着提词器和计时器,主屏上干干净净地展示内容。跟那些需要额外安装插件或买 Pro 版才能用的提词器方案比,这个实现又轻量又实用。

但设计上的取舍也很明显。HTML 格式让后期手动微调变得困难,改一个间距、调一个字的位置,得打开源码改 HTML/CSS。对非技术用户来说,这基本等于”生成什么样就用什么样”。如果能加一个可视化编辑面板,哪怕只是基础的字体大小和间距调整,体验会好很多。这种取舍也反映了作者的产品定位:它服务的不是”先做一版再改八轮”的群体。

使用场景

技术分享是 html-ppt-skill 最擅长的场景。代码块展示、架构图、流程时序,31 种布局都能覆盖。比如做一份微服务治理的技术分享,选 tokyo-night 暗色技术风主题,封面、目录、架构图页面、代码示例、时间线演进、总结回顾,六页下来层次清晰。传统 PPT 模板里,这六页可能用了三套不同来源的模板拼在一起,视觉割裂是常态。但这里每一页都是同一个主题驱动生成的,一致性天然就有了。

产品发布和路演是另一个高频场景。pitch-deck-vc 主题专门为投资路演设计,corporate-clean 适合企业对内汇报。更关键的是演讲者模式,路演时副屏上的提词器和计时器让你不需要一直低头看稿,主屏上干净的产品演示把全部注意力留给听众。这种体验目前在同类工具里很难找到替代方案。

社区实测也验证了它的能力边界。掘金上有评测文章拿它和 ppt-master、frontend-slides、huashu-design 横向对比,结论很直接:html-ppt-skill 的视觉表现力和演讲辅助能力断层领先,但 HTML 格式造成的后期编辑困难是硬伤。如果你需要”做完就能讲”,它是首选。如果你需要”先出一版草稿,然后跟同事联调修改多轮”,ppt-master 那种直接输出 PPTX 的工具更合适。

还有一个被低估的场景:批量生成。用同一套主题,换不同的内容,生成十份风格统一的技术方案 PPT。传统方式下这需要手动对齐每一处样式,而 html-ppt-skill 的主题继承机制让这件事变成了简单的参数替换。

洞察与反思

html-ppt-skill 上线不久就冲到了数千 GitHub Star,社区热度说明它确实踩中了一个真实的痛点。但这个痛点的本质,我觉得被大多数人低估了。

嘴上说”让 AI 做 PPT”,心里想的其实是”帮我省时间”。但真正浪费时间的不是写内容,是排版和调试。内容 AI 已经能写得不错了,排版这一步至今没有好解法。html-ppt-skill 的解法简单粗暴:砍掉 AI 在排版上的自由发挥,用预置设计系统把整个视觉空间锁死。AI 不需要”设计”,只需要从素材库里做匹配和组装。这个思路粗暴但有效。

另一个被低估的点是演讲者模式。市面上大量 AI PPT 工具把宝全押在”生成”上,生成了就完事了。但 PPT 的生命周期不只是生成,还要被演示、被讲述、被打分。html-ppt-skill 在”演示”这个环节上花的功夫,比它在纯生成上还多,说明作者对 PPT 这个品类的理解比大多数竞品深一层。

客观说,HTML 路线不是银弹。它放弃了 PPTX 的编辑便利性和跨平台兼容性。如果你的团队必须走 WPS 或 PowerPoint 做协同修改,这个方案不适用。html-ppt-skill 的目标用户是那些”做好了直接上台讲”的人,不是那些”先做一版再让领导改八轮”的人。这个定位选择不一定适合所有人,但它至少在它瞄准的场景里做到了极致。

这个 Skill 真正给我的启发在于,AI 工具设计中有两个方向:一种是让 AI 模仿人类已有的工具输出格式(比如 PPTX),另一种是重新定义输出格式本身(比如 HTML 演示文稿)。html-ppt-skill 选了后者,而且用 36 套主题证明了这个选择可以走得通。这个信号可能比这个 Skill 本身更重要。

资源地址

资源 地址
GitHub https://github.com/lewislulu/html-ppt-skill

总结

html-ppt-skill 做了一个简单的减法:砍掉 AI 在排版上的自由发挥,用预置设计系统接管审美。效果比想象中好,因为设计系统一旦建好了,AI 只需要做它擅长的事,组织内容、匹配模板、输出结构正确的页面。

演讲者模式是意外收获。独立窗口、提词器、计时器、实时同步,这四个功能组合在一起,让”讲 PPT”的体验提升了一个台阶。

用不用它,判断标准其实很简单。需要频繁编辑迭代、多人协作修改的,去用 ppt-master 或者 huashu-design,它们输出 PPTX。核心需求是快速出一份能直接投屏演示的 PPT,而且对视觉效果有要求,html-ppt-skill 目前是最优解。

skills资源

精选 8 个 UI 设计师必备的 AI Agent Skills,彻底告别无效加班!

2026-6-16 22:30:00

行业动态

AI-Generated UI 技术深度解析:模型流式输出与 UI 渲染实践

2026-5-13 16:22:08

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧