-
Gemini 3.5 Flash 测评:当 Flash 系列开始干翻旗舰,谷歌的 Agent 时代来了
写个复杂 Agent 还要等几十秒才能动?Gemini 3.5 Flash 把输出速度干到了 280+ token/秒,直接是 GPT-5.5 和 Claude Opus 4.7 的 4 倍。在编码和智能体基准上,它甚至反过来碾压了自家上一代旗舰 Gemini 3.1 Pro。$1.5 的输入价格、90% 的缓存折扣、默认开启的 Thinking 模式,这个 Flash 系列新王,把"快…- 68
- 0
-
十年老技术开发的 AI Agent 探索之路
作者:zhiyuanfu 曾经前端被戏称为"娱乐圈"——工具、框架层出不穷,今年🔥 的明年就过时。现在 AI 把这个周期压缩到了以月计:这个月的新概念,下个月可能就是旧闻。这篇文章,就是一个在"AI 娱乐圈"摸爬滚打的老开发,试图从月抛式的焦虑中找到不会过期的东西,为大家抛砖引玉。 4-6 个终端的并发上限,怎么突破 80% 的 AI 需求,10 行 Bas…- 2k
- 0
-
Manus 深度评测:全球首款通用型 Agent,到底能不能真干活?
让 AI 自己去查资料、做报告、建网站,听起来很爽,但 Manus 真的做到了几分?这款由前 Monica 团队打造的通用 Agent,上线即爆火,GAIA 测试力压 OpenAI Deep Research。随后被 Meta 花 20 亿美元买下,又遭国家发改委叫停,产品未稳,风波不断。实测下来,研究和数据采集是强项,编程开发却一言难尽。$19 起步不算贵,但服务器稳定性扣了不少分。一句话:想做…- 58
- 0
-
World Model(世界模型):AI开始有”想象力”了
你有没有想过这个问题: 当你说"把杯子推下桌子",你的脑子里发生了什么? 你可能看到了杯子摇了一下、然后倒下、最后摔在地上——甚至能听到"啪"的一声。 这个过程,你没有真正看到,但你在脑子里"模拟"了一遍。 这就是人类的世界模型——我们有一个对世界的内部模拟,知道动作会导致什么结果。 World Model(世界模型),就是让AI也拥有这…- 840
- 0
-
CodeBanana 评测:当 AI Agent 开始替团队写代码、开会议、管项目
上周跟一位做 SaaS 的朋友吃饭,他吐槽团队里最痛苦的事不是写代码,而是"写完之后要同步给产品、测试、运营,每个人都在不同的工具里问同样的问题"。回来我搜了一圈,发现 CodeBanana 这个工具打的正是这个痛点,它把自己定位成"AI Agent 协作平台",核心逻辑是把 Agent、聊天、工作区三件事塞进同一个项目空间,让沟通直接变成执行。听起来有点理…- 25
- 0
-
AI大事件:Claude Opus 4.7再升级,梁文锋计划融资20亿,阿里、腾讯同日开源世界模型
今天我认真翻了翻AI圈的新消息,发现有几个变化挺有意思的——Anthropic这次直接把Claude Opus拉到了4.7,编码和Agent能力又上了一个台阶;具身智能那边,智元直接搞了2500人的合作伙伴大会,4款新本体现成亮相,这个赛道真的在加速;阿里的世界模型也出来了,视频编辑方向直接冲到了全球第一。数字层面上,中国日均词元调用量突破140万亿,Stanford的报告说中美模型差距只剩2.7…- 1.3k
- 0
-
Agentic Workflow(智能体工作流):让AI从”答案生成器”变成”数字员工”
一个让人清醒的对比: 你用ChatGPT写邮件——你写Prompt,它给答案,你复制粘贴发出去。每次都是如此。 你用Agentic AI写邮件——你说"帮我跟进上周那个客户",它自动找到客户记录、查阅历史邮件、生成个性化邮件草稿、甚至帮你预约发送时间。你只需要点一个"发送"。 同样是AI,差距怎么这么大? 这就是Agentic Workflow和普通AI工具…- 873
- 0
-
详尽地带你从零开始设计实现一个AI Agent框架
作者:yabohe 年初火爆现在热度依旧的OpenClaw为AI Agent带来了新的想象。如果说2025是AI Agent智能体元年,想必2026将会是AI Agent真正商用化的开端,而AI Agent商用化的前提是各行各业开始落地实际商业领域的AI Agent。 作为一名程序员/工程师,思考的更多的可能是如何将AI Agent落地实现的层面。工程框架往往是工程应用实现的基石,框架选型也是架构…- 853
- 0
-
Workflow:AI时代的”流水线”,到底在管什么?
很多人以为Workflow就是"步骤列表"——第一步做什么、第二步做什么。听起来简单,但如果你真的这么理解AI时代的Workflow,可能会错过它最有趣的部分。 Workflow不是"说明书",而是一套让AI能稳定产出、可重复执行的工作机制。 一句话理解 Workflow = AI处理任务的"标准流水线"——定义输入什么、中间经过哪些环节…- 865
- 1
-
AI日报:智元GO-2打通“最后一公里”,腾讯阿里字节同日亮剑AI新战场
周五了,简单聊聊今天的AI圈动态。今天值得关注的还挺多——具身智能这边热闹了,智元发新模型、大会扎堆;大模型那边也没闲着,腾讯发新版本、国产这边融资不断。好了,不啰嗦了,看内容吧。 1. 智元机器人发布GO-2具身基座大模型 核心内容:智元机器人正式发布新一代具身基座大模型Genie Operator-2(GO-2),首创动作思维链技术,首次在统一架构中实现从逻辑推理到精准动作执行的闭环。基于数万…- 1.5k
- 0
-
分享本周GitHub最火的10个项目,第3个让我眼前一亮
今天刷GitHub Trending,发现这周有几个项目挺有意思的,忍不住想跟你们分享一下。 说实话,这两年GitHub上的AI项目越来越多,但真正能让人"哇"出来的越来越少。不过这周还真让我发现了几个不错的,有些是真的解决了痛点,有些是思路很巧妙。废话不多说,直接上正文。 1. AI-Scientist-v2:让AI自己搞科研写论文 说实话,看到这个项目的时候我有点震惊。Sa…- 991
- 0
-
Cursor 3评测:你的IDE正在变成 Agent 的终端
说实话,之前每次看到\"AI 编程工具\"这几个字,我都有点审美疲劳了。代码补全、代码解释、代码审查——翻来覆去就这些功能。但 Cursor 3 不一样,它直接干了件大事:把 IDE 变成了 AI Agent 的控制台。这意味着什么?意味着你不再是在\"用 AI 写代码\",而是\"让 AI 帮你管项目\"。上周我花了三天深度体验了 Cu…- 1k
- 1
-
【万字教程】OpenClaw 核心机制 Skills 全解析
三月份,OpenClaw 小龙虾爆火,但火得有些不正常; 今天是最后一篇关于 OpenClaw 的架构拆解,也是我认为最重要的 Skills,我会尽量把他说清楚。 如果你要问我 OpenClaw 的价值,我会说他再次证明了 Agent 这种产品模式会是未来,并且他展示了普通人大概会如何与 Agent 做交互,这个答案就是 Skills... PS:OpenClaw 是当前 Agent 最典型的代表…- 927
- 0
-
AI日报:AI”动手”元年到了,Claude能控制Mac,谷歌内部Agent把服务器搞崩,具身智能进入清场模式
今天是周日,但AI圈完全没有休息的意思。我是老曹,早上刷完消息,感觉有点兴奋——这一两天动作密集:IntelliJ IDEA 2026.1 直接内置多款AI智能体;谷歌内部那个叫Agent Smith的工具把服务器搞崩了,联合创始人布林亲自下场写代码;具身智能那边,行业清场已经开始,宇树冲IPO,星动纪元刚刚完成10亿融资——有人在狂奔,有人已出局。Claude Computer Use也正式落地…- 883
- 0
-
飞书Lark CLI测评:让 AI 直接操作飞书的秘密武器
最近我一直在研究怎么让 AI Agent 真正能干实事,不只是聊聊天。然后发现了飞书刚开源的 Lark CLI,说实话一开始没抱太大期待——企业开源的工具嘛,你懂的,多半是那种文档不全、配置复杂的开发者玩具。结果试了一下,发现这玩意儿居然内置了 19 个 AI Skill,能让 AI 直接操作飞书发消息、建文档、查日程。这个定位挺有意思的,明显是冲着"AI 原生"去的。 一、L…- 872
- 0
-
Tair短期记忆架构实践:淘宝闪购 AI Agent 的秒级响应记忆系统
引言 当你对千问说一句"帮我点杯霸王茶姬的伯牙绝弦,少糖去冰,送到公司",背后的 AI Agent 需要在数秒内完成意图识别、地址解析、商品搜索、规格匹配、加购下单等一系列操作。整个过程涉及多轮对话、多次工具调用,每一步都依赖对"之前发生了什么"的准确记忆。 这就是 AI Agent 的短期记忆问题。在淘宝闪购与千问合作的"句话点外卖"项…- 719
- 0
-
AI日报:具身智能”清场”开始!银河通用融资25亿估值超200亿,行业进入淘汰赛阶段
早上好!我是老曹。今天刷了一圈AI圈的消息,发现具身智能这块儿真是冰火两重天——一边是Figure AI发布号称"地球上最先进"的Figure 03,银河通用融资25亿估值超200亿;另一边是中小公司开始变卖服务器、团队面临解散。这种"清场"的态势说明行业正在加速分化。另外OpenAI也搞了个大动作,直接关停了Sora转向AI代理。总的来说,今天值得关注的点…- 793
- 1
-
n8n测评:开源工作流自动化的标杆,如何成为AI Agent时代的香饽饽
讲真,我之前一直觉得工作流自动化是个挺无聊的赛道——无非就是"当X发生时,执行Y"这种简单逻辑。Zapier、IFTTT早就把这事儿玩明白了,还能玩出什么花来?直到我深入研究了n8n,才发现这个德国团队把"工作流自动化"这件事做出了完全不同的味道。2025年10月拿到1.8亿美元C轮融资、估值冲到25亿美元,NVIDIA、Accel、Redpoint抢着投;…- 1k
- 0
-
阶跃AI桌面伙伴评测:被网友称为”中国版Claude Cowork”的桌面AI助手(含邀请码)
今年除了龙虾OpenClaw火爆之外,其实桌面AI Agent也算是热门,各大厂都在推自己的桌面智能体。腾讯出了QClaw,阿里有悟空…但说实话,真正让我眼前一亮的,是阶跃星辰的"阶跃AI桌面伙伴"。说它是中国版Claude Cowork一点都不夸张——免费、全平台、还能操作电脑执行复杂任务。用了大概两周,我来聊聊真实体验。 先说整体感受:如果你想在Windows或Mac上用一…- 585
- 1
-
MuleRun:全球首个AI Agent市场,让”养骡子”成为新生产力
最近我在研究 AI Agent 赛道的时候,注意到一个产品——MuleRun。老实说,第一眼看到它"全球首个 AI Worker 市场"这个定位,我以为又是一个营销噱头。结果深入看下去,发现这家公司做的事情比大多数 Agent 产品都要系统——它不只是让你"用 AI",而是给 AI 配了一套完整的"数字工位",让它像真正的员工一样全天候在…- 458
- 0
































