-
给野马套上缰绳:Agent Harness 工程实践 ——从范式理论到钉钉AI招聘的真实落地
阿里妹导读 写在前面:这不是一篇"概念科普文"。它是写给所有正在被 Agent 折磨、又离不开 Agent 的开发者——那些一边惊叹于一晚上跑出一个像样的 PR、一边在凌晨三点回滚生产事故的人。 关于引用的一句郑重交代:文中所有第三方数据,已尽量回溯到原始博客或官方文章;个别行业流传的数字,无法核实到一手来源时,已经主动软化或删除,并明确标注。文章的工程判断与实战经验,来自我们…- 1.2k
- 0
-
OpenClaw、WorkBuddy、Loop 工程:谁在火,谁有用,谁还在 Demo
今年,市场被 OpenClaw 洗了一波,数字员工的概念开始撬动人心,随后类似的 Agent 便如雨后春笋,比如 Hermes、Aipy、WorkBuddy、钉钉悟空、字节 Aily... 与 Agent 相关的专业名词也层出不穷,包括 Context Engineering、ReAct、Harness、MCP、Skills、Agent Loop... 这种多且杂的局面,把很多人搞得很慌、搞得很乱…- 1.2k
- 0
-
OpenClaw 创始人吹的 Loop 工程到底是个撒?不用写提示词了?
来,又来,AI 领域又来新名词了!这次是 Loop Engineering。 借此机会,大家也顺便复习下过去 3 年一些火过的名词,看还记得撒: Prompt Engineering、RAG、Context Engineering、ReAct、Agent、MCP、Skills、Harness... 如果对 AI 工程有一定认知的同学会了解:上述名词很多都是在炒冷饭,他们很有点对某个概念再包装的嫌疑…- 1.1k
- 0
-
Academic Research Skills:最狠的设计是不替你写论文
学术写作的 AI 工具有一个通用剧本:扔一篇论文进去,吐一篇改好的出来。看起来很爽,用起来会发现改出来的东西像穿着你外套的另一个人。Academic Research Skills(下称 ARS)走了一条完全相反的路线,它把论文写作拆成了 10 个阶段,每个阶段都有强制的人机确认点。读它的 README 第一句话就定了调:“AI is your copilot, not the pilot.” 这…- 1.1k
- 0
-
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
目录 一、Hermes Agent 让流程可控 二、用单 Agent 串流程,用能力模块沉淀可复用能力 1.固化流程契约 2.可复用能力模块设计:从埋点链路迁移到更多数据研发场景 三、总体工作流:从一次对话变成一条可回放链路 四、能力底座:把规则、上下文和命令资产化 1.规则资产化:先决定什么值得记住 2.协作可见:让 AI 不在后台默默跑完 3.上下文与事…- 1k
- 1
-
读完Agent Loop工程手册,我有8个还没想明白的问题
关注腾讯云开发者,一手技术干货提前解锁👇 来源说明 文中提到的 Agent Loop:来源 = Peter Steinberger(OpenClaw创始人)近期提出的"从写 Prompt 到设计 Loop"范式 + Boris Cherny(Claude Code 创始人)公开实践 + 社群整理的工程手册(Reddit / X 讨论量约 220 万)。我读的是社群手册和公…- 981
- 0
-
高德广告工程 AI Native 全流程提效实践
导读 本文介绍高德广告工程团队在 AI Native 研发、测试、运维和知识沉淀方向的阶段性实践。 我们的核心判断是:AI Native 不是“用 AI 写代码”,而是把研发体系设计成 AI 能持续参与、稳定执行、可验证、可复用、可进化的工程闭环。 围绕这一判断,我们把 Spec、知识、验收、执行状态、Skills 升级为与代码同等地位的工程产物,并通过广告 Harness、统一知识库、统…- 1.1k
- 0
-
一篇搞懂 AI Coding Agent 的 Token 成本控制
作者:devinyzeng 适用:CodeBuddy、Cursor、Codex、Gemini CLI 等这类 AI Coding Agent。 读完你会得到三样东西:一个正确的心智模型、一份今天就能做的行动清单、几套继续往下压成本的工程方法。 月初看账单,吓一跳。 也没问多少问题,Token 怎么烧成这样? 后来认真拆了一轮,才发现一个反直觉的事实: 你问的那句话,在每次请求里可能连 1% 都不到…- 1.3k
- 0
-
Coding Agent 下半场:从个人提效到组织级研发体系
当下还在古法手搓代码的开发者都是在奔着非遗传承人的目标去了,绝大多数都已经用上了 Claude Code、Cursor 这类 Coding Agent。方向对了,但场景不同,解法也不同 —— 开发者自己在本地装个 AI 助手提效,和在组织内部搭起一套 AI 驱动的研发协作体系,是完全两个维度的事情。前者已经有成熟的产品了,后者才刚刚开始。本文聊的就是后者。 什么是组织级 Coding…- 1k
- 0
-
AI 催生的四个岗位:AI 全栈、FDE、AI PM、Workflow
最近我被下面一个同学搞麻了...... 原因是大概一周前给他布置了个工作,临了的时候看到他给了我一个万字长文,似乎很认真啊! 但不要高兴得太早,因为读起来的质量是又高又低:经常出现金句,但整体逻辑性太低,而且车轱辘话很多,拿去 AI 查重,果然啊: 好家伙,该不会是我给了他一周的时间,他一小时就用 AI 干出来想来交差了吧? 于是,我拿着文章中的内容请教他,结果是各种磕磕巴巴,完全不成体系啊,看来…- 2k
- 0
-
一个令人惊艳的开源项目,Agent Skill 开始自进化了?
大家好,我是苍何。 最近我在 GitHub 上刷到一个很有意思的开源项目。 让 Agent 学会自己组织技能 这个项目叫 OpenSquilla,目前已经拿了 3700 多 Star。 它的核心方向是 Harness 层优化,通过智能模型路由来降低 token 成本。 最新推出的 MetaSkill 3.0,更是把 Agent 从「会调用工具」推进到了「会自组织技能、稳定交付工作流」。 说实话,看…- 1k
- 0
-
知识库分层编排:从 RAG 到 Agent-native Knowledge Context Layer
阿里妹导读 文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。 一、知识库的根本困境 从一个知识库检索超级微服务高级skill开始的思考。 1.1 RAG 的天花板 RAG(Retrieval-Augmented Generation)是当前最流行的知识库方案:把文档切成 chunk → embedding → 用户 query 时向量检索 Top-K → 喂给 LLM 生成答…- 1.4k
- 0
-
2026过半:一万字,把这半年AI发生的事讲明白
大家好,我是冷逸。 昨天晚上做饭的时候,我用手机命令电脑里的 AI 干了三件事:打开一堆 PDF 发票整理成 Excel 报销单、一句话给电影《火遮眼》做一个带宣传视频+海报的网站,以及按我的风格给这篇稿子写个开头。 饭做完,活儿干完了。 这种事,一年前是科幻,今年是日常。 我说这个不是要煽情。我是想说,2026 上半年的 AI,已经不是“哪个模型分高”那回事了。模型这一头的卷,到 GPT-5.5…- 1.4k
- 2
-
Coze 3.0 的背后:AI 编程杀进来后,Dify、n8n 还能活多久?
最近 AI 圈有个事件:Coze3.0 发布了,只不过貌似并没有扬起太大的水花: 上一次关于 Coze 的大事件应该追寻到一年前的核心模块开源了: 当时大家还会为 Dify 捏把汗,在好奇 Coze 的开源会不会对他造成影响,结果大家也知道了:受 Agent 尤其是 AI Coding Agent影响,整个这种编排的低代码平台似乎都活得不太好。 那么今天的问题也就来了: 为什么 Coding Ag…- 1k
- 0
-
耗时30天,WeSight正式开源:一个入口,用所有 Agent
大家好,我是苍何。 我的产品 WeSight 在 4 月 8 号推出后,邀请码就被炒到了 999 元一个。 虽然感觉有点滑稽的,但当时的 WeSight 可见直击多少人的痛点。 但它是不"光明的","上不了台面的",于是我主动关停了这个项目。 在认真思考了一个月后,我在 5.1 号决定重启 WeSight 这个项目,让她能堂堂正正的可以和大家见面。 在长达一…- 1.3k
- 0
-
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
01 引言 Cloud Native 2025 年,AI Agent 从实验室走向规模化生产落地。从开发者日常使用的代码助手到企业服务场景下的智能客服,到复杂度持续升级的多智能体协同系统,AI Agent 正在以前所未有的速度重塑软件开发方式和业务运转流程。 然而,当 Agent 真正跑起来之后,一个尖锐的问题浮出水面:AI Agent 的实际运行行为难以感知、追溯与管控。 代码类 Agent 深…- 917
- 0
-
Agent 需要 RAG 吗?
依旧延续周一 TGO 闭门会的分享思考,核心话题是:如何真正蒸馏一个人 + 如果完成了蒸馏动作,应该如何形成企业级 Agentic RAG 数据库类应用? 怎么说呢,现阶段为了适应 Agent 发展,模型本身已经往前走了很大一步,最核心的两个能力: 一个来自于模型本身,提供了百万级上下文窗口; 一个来源于工程能力优化,Skills 缓解了模型不稳定问题; 现阶段 Agent,在数据处理一块有了很大…- 967
- 0
-
阿里云海外重磅发布 Qwen Cloud
阿里云在新加坡面向全球市场正式发布 Qwen Cloud(qwencloud.com)。阿里云首席技术官、国际业务总裁李飞飞表示:“海外市场对 AI 的需求持续旺盛,尤其是 Agent(智能体)的爆发让模型调用量和云资源消耗呈指数级增长。当 Agent 成为云服务的第一用户,围绕人类设计的界面和交互逻辑都需要被重写。Qwen Cloud,正是为AI Agent 而生的全新服务方式。 专为Agent…- 909
- 0
-
Agent Harness 可观测性:生产级 AI 项目必须补上的一课
今年开始,Agent 的基础执行环境从能力上已经 OK,所以逐渐开始有很多产品真正的走向生产,这个时候如何让 Agent 长期稳定的运行,如何正确的执行长链路复杂任务就变得很重要了; 现阶段所有围绕 Agent 工程架构的技术被称为 Harness,关于什么是 Harness 我们之前已经做过概括介绍,而今天我们将话题缩小,重点关注课题:Agent 的执行可观测性。 该课题产生的原因来源于某产品负…- 1.3k
- 0
-
Tools 治理经验分享:Agent 需要什么工程执行环境?
最近遭遇知识诅咒了,在做培训的时候会发现一个情况:我们以为的常识,在其他人看来是卡点,而因为这种卡点多了,整体学习效果就很差,而今天要聊的“常识性卡点是 Function Calling”... 我第一次接触 Function Calling,是一个天气查询 Demo。用户问一句天气,模型返回一个 get_weather,应用层查完天气,再把结果交给模型生成回答。 流程一跑通,很容易让人觉得,它就…- 1.2k
- 0
-
天天嚷嚷着做Agent Harness,但具体工作是什么?
最近刷几个模型厂牌的招聘信息(定期刷可以提前预知这些公司的动作),发现 DeepSeek 和 Kimi 都上了 Harness 产品经理岗位。 是的,DeepSeek 要推出桌面 Agent 客户端了! 一个叫"Agent Harness 产品经理",一个叫"Harness Product Engineer"。 这篇文章就从这两份 JD 出发,借着专业团队对…- 1.2k
- 0
-
AI 团队协作案例:全链路研发提效实践分享
我之前说过,现阶段通用大模型基本能力包括通识、推理、成本、效率,都没什么问题了,那么他一定会演进为某“通用垂直领域的偏科模型”,而事实上也确实如此: 现阶段基座模型有很大的精力都是围绕 Coding 展开的 关于为什么选 AI Coding,或者产研这个领域,之前我们也有过探讨,无非是 Coding 首先最好做,其次他既是通用能力,又具备收集垂直领域知识的能力,什么意思呢? 意思是,GitHub …- 1.4k
- 0
-
Horizon:亲手打造你自己的AI信息雷达
AI时代,天上一日,地上三年! AI/Agent相关信息太多太散,估计很多人日常获取AI/Agent相关信息也是东一榔头西一棒槌的。 前不久卡兹克卡神开放了他的AIHOT(https://aihot.virxact.com/),功德一件! 不过由于卡兹克团队毕竟是盈利性质的,没有全部开源出来。 这两天,我发现有个开源项目Horizon(https://github.com/Thysrael/Hor…- 1k
- 0
-
Agent核心技术概念与范式发生了哪些演变以及背后的思考
阿里妹导读 文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。 背景 近几年,随着基模能力的快速升级与迭代,Agent 领域迎来了爆发式的增长。特别是近期,像 Cloud Code、Codex、OpenClaw、Hermes 等可以说是全新一代的 Agent 产品和框架在不断涌现,Agent 的能力相比早期版本也出现了进一步的跃升,进一步推动了整个 Agent 生态的繁荣发展。…- 1.2k
- 1
































