今天刷GitHub Trending,发现这周有几个项目挺有意思的,忍不住想跟你们分享一下。
说实话,这两年GitHub上的AI项目越来越多,但真正能让人”哇”出来的越来越少。不过这周还真让我发现了几个不错的,有些是真的解决了痛点,有些是思路很巧妙。废话不多说,直接上正文。

1. AI-Scientist-v2:让AI自己搞科研写论文
说实话,看到这个项目的时候我有点震惊。Sakana AI联合几所大学搞出来的这个AI-Scientist-v2,真的能把整个科研流程跑下来——从提出想法、搜文献、设计实验、写代码跑实验,最后到写出完整论文,全程自动化。
最让我惊讶的是,它生成的论文居然通过了ICLR 2025 Workshop的同行评审,评分6.33,超过55%的人类投稿。2026年3月还正式发表在Nature上了,这说明学术界也认可了。
技术上也挺有意思的。它用渐进式Agent树搜索,可以并行探索多条研究路径。还有个自动评审器,模拟Area Chair评审,准确率能到69%。成本也不高,一次完整实验大概20-25美元,耗时几小时。
建议:在Docker沙盒里跑比较安全。
开源地址:https://github.com/SakanaAI/AI-Scientist-v2
2. VibeVoice:微软这次做语音AI有点猛
微软出的这个VibeVoice,我之前还真没听说过。它包含语音合成和语音识别,而且做得挺极致的。
语音合成单次能生成90分钟的多说话人对话,语音识别单次能处理60分钟的音频,不需要切片。更良心的是,消费级GPU就能跑,那个轻量级实时TTS模型只有0.5B参数,首音频延迟大概300ms。
有意思的是,这个项目曾经被滥用删除过仓库,后来重新上架,Star数从8K飙升到3.5万。说实话,这种”先被滥用再爆红”的剧本也是挺戏剧性的。
开源地址:https://github.com/microsoft/VibeVoice
3. Hermes Agent:会自我进化的AI Agent
这个是本周让我眼前一亮的项目。Hermes Agent是Nous Research搞出来的,最大特点就是会自我进化——它能自动把经验提炼成可复用的技能文件。
更骚的是它支持200多个模型,一行命令就能切换提供商。通过Gateway进程还能直接对接飞书、企业微信等十多个平台。支持从OpenClaw迁移记忆和Skill。
说实话,这种能自我进化的Agent才是真正的Agent该有的样子,而不是只会执行命令的工具人。
开源地址:https://github.com/NousResearch/hermes-agent
4. Onyx:开源的企业级AI搜索
之前叫Danswer,现在改名Onyx了。这个是YC W24的项目,2025年拿了1000万美元种子轮,Netflix、Ramp这些公司都在用。
它的功能就是整合企业内部分散的信息源——GitHub、Google Drive、Confluence、Slack等等,通过自然语言提问就能给你精准答案。还有Deep Research、代码沙箱执行、语音模式、图像生成这些附加功能。
最方便的是,一条命令就能部署。Star数2.3万,确实挺火的。
开源地址:https://github.com/onyx-dot-app/onyx
5. Claude Code学习指南
这个不是工具,是个学习资料。claude-howto是个超全的Claude Code学习指南,涵盖10个教程模块,总学习时长11-13小时。
提供了生产级模板和可视化教程,还支持生成EPUB电子书离线阅读。对于想系统学习Claude Code的朋友来说,这个资源挺不错的。Star数1.7万。
开源地址:https://github.com/luongnv89/claude-howto
6. oh-my-claudecode:给Claude Code装上19个专业Agent
这个有意思。作者做了19个专业Agent——架构师、规划师、执行者等等,支持任务自动拆解与分派。
几个亮点:
- Team Mode一键启动完整开发流水线
- 智能模型路由,简单任务用Haiku,复杂推理用Opus,能节省30-50% Token
- Skill学习系统自动提取调试知识
安装也简单,通过Claude Code插件命令三步搞定。Star数1.1万。
开源地址:https://github.com/Yeachan-Heo/oh-my-claudecode
7. oh-my-codex:把多Agent编排移植到OpenAI Codex
同样是这位作者,把多Agent编排的理念移植到了OpenAI Codex CLI上。
30个专业Agent角色,40多个Skill。支持在tmux里启动最多20个Worker并行工作,还能混合Codex和Claude的Worker协作。
npm install -g oh-my-codex之后运行omx setup就能用。Star数1.4万,而且只用了两个月就涨到这个数,增长速度挺猛的。
开源地址:https://github.com/Yeachan-Heo/oh-my-codex
8. last30days-skill:一句话搜遍全网最近30天热点
这个工具挺实用的。一句话就能搜索全网最近30天的讨论,覆盖Reddit、X、YouTube、TikTok、Instagram等10个信息源,输出带引用的研究报告。
还有个比较模式,比如”Claude Code vs Codex”,能并行生成两者的优劣势对比。平均70秒完成一次研究,效率挺高的。Star数1.8万,增长很快。
开源地址:https://github.com/mvanhorn/last30days-skill
9. OpenScreen:Screen Studio的开源替代
如果你之前用过Screen Studio(那个商业屏幕录制美化工具,月费29美元),现在有免费的开源替代品了。
OpenScreen能录制屏幕、自动缩放平移动画、动态模糊、多种背景选项、标注添加。支持手动缩放、自定义深度和时长。跨平台支持macOS、Windows、Linux。
目前还在Beta阶段,Windows导出速度待优化。Star数1万多。
开源地址:https://github.com/siddharthvaddem/openscreen
10. TaxHacker:AI帮你记账算税
这个工具挺有意思的。通过拍照或上传PDF收据发票,AI自动提取商品名称、金额、日期、商家、税额等信息。
支持170多种法定货币和14种加密货币,按历史汇率自动换算。Prompt完全可定制,支持自定义字段。隐私方面也考虑到了,支持本地LLM通过Ollama离线运行。
开源地址:https://github.com/vas3k/TaxHacker
总结
说实话,这周GitHub上的项目质量还不错。让我印象最深的是AI-Scientist-v2和Hermes Agent——前者说明AI搞科研真的不远了,后者代表了我一直期待的真正有自我进化能力的Agent形态。
其他项目中,VibeVoice的语音能力、TimesFM的时序预测、还有几个Claude Code工具集都挺实用的。如果你看到什么有意思的项目,欢迎在评论区聊聊。

