最近几个月,OpenClaw 彻底引爆了 AI 圈,媒体、社区与开发者论坛内讨论不断,掀起了一股全民“养龙虾”热潮。在 GitHub 的 AI 热门榜单上,它的 Star 数更是一路狂飙,直接登顶。
💬 嗨!你正在阅读 NocoBase 博客。NocoBase 是一个极易扩展的 AI 无代码/低代码开发平台,用于构建企业应用、内部工具和各类系统。它完全支持自托管,基于插件架构设计,开发者友好。→ 欢迎在 GitHub 上了解我们
有媒体直接把 OpenClaw 写成 “The Rise of a New King on GitHub”。如果只把它理解成一次单纯的项目爆红,可能还是低估了这波热度背后的变化。从 OpenClaw 开始,2026 年开源 AI 关注重点也在明显转移。
去年,我们也盘点过 GitHub 上最受关注的 20 个开源 AI 项目,当时榜单里热门项目的核心仍然是模型能力、聊天界面以及开源路线是否能逼近闭源产品体验。但今年榜单里的项目已经发生了翻天覆地的变化。开源 AI 的关注重点已经在进一步转向智能执行、流程编排、多模态生成等更贴近实际应用的方向。
基于这个变化,我们重新盘点了 2026 年 GitHub 上 Star 最高的 20 个开源 AI 项目,并做了简单分类。从中选出部分代表性项目,介绍它们各自的核心能力、功能特点,以及各自在 AI 方向上的独特价值。
2026 年最值得关注的 20 个开源 AI 项目
以下项目按 GitHub Star 数排序
| 排名 | 项目名称 | Star | 核心关键词 | 适用人群 | 一句话定位 | GitHub 链接 |
|---|---|---|---|---|---|---|
| 1 | OpenClaw | 302k | 智能执行 | 个人 | 面向个人场景的开源 AI 助手,强调跨平台执行任务 | openclaw/openclaw |
| 2 | AutoGPT | 182k | 智能执行 | 开发者 | 经典的自主智能体项目,强调任务拆解与自主执行 | Significant-Gravitas/AutoGPT |
| 3 | n8n | 179k | 流程编排 | 企业 | 支持原生 AI 能力的工作流自动化平台 | n8n-io/n8n |
| 4 | Stable Diffusion WebUI | 162k | 多模态生成 | 创作者 | 面向 Stable Diffusion 的经典网页交互界面 | AUTOMATIC1111/stable-diffusion-webui |
| 5 | prompts.chat | 151k | 提示词资源 | 个人 | 开源提示词社区与提示词收藏平台 | f/prompts.chat |
| 6 | Dify | 132k | 流程编排 | 企业 | 面向智能体工作流的生产级 AI 应用开发平台 | langgenius/dify |
| 7 | System Prompts and Models of AI Tools | 130k | 研究资料 | 开发者 | 汇总多种 AI 工具系统提示词、内部工具与模型信息的资料仓库 | x1xhlol/system-prompts-and-models-of-ai-tools |
| 8 | LangChain | 129k | 流程编排 | 开发者 | 面向大模型应用与智能体开发的编排框架 | langchain-ai/langchain |
| 9 | Open WebUI | 127k | 应用入口 | 个人 | 面向 Ollama、OpenAI API 等模型的 AI 交互界面 | open-webui/open-webui |
| 10 | Generative AI for Beginners | 108k | 学习资源 | 开发者 | 面向生成式 AI 初学者的系统课程仓库 | microsoft/generative-ai-for-beginners |
| 11 | ComfyUI | 106k | 多模态生成 | 创作者 | 基于节点工作流的图像生成界面与后端 | Comfy-Org/ComfyUI |
| 12 | Supabase | 98.9k | 数据与上下文 | 企业 | 支持 Web、移动与 AI 应用的数据平台 | supabase/supabase |
| 13 | Gemini CLI | 97.2k | 智能执行 | 开发者 | 将 Gemini 能力带入终端场景的开源 AI 智能体 | google-gemini/gemini-cli |
| 14 | Firecrawl | 91k | 数据与上下文 | 开发者 | 将网站转成可供大模型直接使用数据的网页数据接口 | firecrawl/firecrawl |
| 15 | LLMs from Scratch | 87.7k | 学习资源 | 开发者 | 从零实现类 ChatGPT 大模型的教学项目 | rasbt/LLMs-from-scratch |
| 16 | awesome-mcp-servers | 82.7k | 工具连接 | 开发者 | 收录 MCP Server 的开源项目清单 | punkpeye/awesome-mcp-servers |
| 17 | Deep-Live-Cam | 80k | 多模态生成 | 创作者 | 支持实时换脸与视频生成的开源工具 | hacksider/Deep-Live-Cam |
| 18 | Netdata | 78k | AI 运维 | 企业 | 引入 AI 能力的全栈可观测平台 | netdata/netdata |
| 19 | Spec Kit | 75.7k | AI 工程 | 开发者 | 面向规范驱动开发的工具包 | github/spec-kit |
| 20 | RAGFlow | 74.7k | 数据与上下文 | 企业 | 融合 RAG 与智能体能力的上下文引擎 | infiniflow/ragflow |
从表格里也能看出,这些项目并不完全是同一种类型。像学习资源、提示词资源和研究资料这类项目,更适合作为补充参考;如果要看今年开源 AI 的核心热点,还是要回到更有代表性的产品和工具上。所以下面我们会围绕四个方向继续展开介绍:智能执行、流程编排、数据与上下文,以及多模态生成。
智能执行
OpenClaw
- GitHub 链接:https://github.com/openclaw/openclaw
- 官网链接:https://openclaw.ai
- GitHub Star:302k
相信大家对 OpenClaw 已经很熟悉了,我们这里还是再简单介绍一下。
OpenClaw 是一个面向个人场景的开源 AI 助手,核心定位是把 AI 接进用户已经在使用的沟通环境里,不用再单独做一个新的入口。它本身也是一个自托管网关,强调运行在自己的设备和规则之下,更贴近开发者和高频个人用户的使用习惯。
核心能力
把 AI 助手放进现有消息渠道和设备环境里
OpenClaw 可以接入 WhatsApp、Telegram、Discord、iMessage、Feishu 等多个渠道,在同一个 Gateway 下处理消息、会话和路由。同时,它支持语音唤醒、持续语音、Live Canvas,以及 iOS、Android、macOS 等多端节点能力,让 AI 不只是停留在聊天框里,而是可以跟消息、设备和交互界面一起工作。

具备持续在线和可继续扩展的结构
OpenClaw 可以在本地机器或服务器上运行一个 Gateway 进程,再通过各类消息渠道持续接收和响应请求。除此之外,它还支持插件扩展,除了默认能力之外,也可以通过扩展包继续接入 Mattermost 等更多渠道和功能。

AutoGPT

- GitHub 链接:https://github.com/Significant-Gravitas/AutoGPT
- 官网链接:https://agpt.co
- GitHub Star:182k
AutoGPT 是一个围绕 AI 智能体构建的开源项目,核心定位不只是提供一个可直接使用的助手,而是进一步把智能体的创建、部署和运行组织成一套更完整的平台能力。相比更偏单点使用的产品,它更强调把智能体从实验性体验推进到可持续运行和可继续扩展的形态。
核心能力
围绕智能体的创建、部署和运行提供更完整的平台结构
AutoGPT 关注的重点是把构建、部署、管理和运行这些环节放到同一套体系里处理。它已经不只是一个早期 autonomous agent 项目,而是在往更完整的智能体平台方向延伸。

持续运行和长期任务承接
AutoGPT 支持持续运行的智能体形态,也延伸出了平台、市场和能力模块等配套内容,更适合承接自动化任务和长期工作场景。和更偏个人助手的产品相比,它更接近开发者和平台使用场景,也更偏向企业和构建侧。
Gemini CLI

- GitHub 链接:https://github.com/google-gemini/gemini-cli
- 官网链接:https://geminicli.com
- GitHub Star:97.2k
Gemini CLI 是 Google 推出的开源 AI 智能体工具,核心形态是把 Gemini 的能力直接带到终端里使用。相比更偏聊天入口的产品,它更贴近开发者日常工作环境,重点放在本地项目上下文、命令行操作和连续任务处理这些更真实的开发场景里。
核心能力
把 AI 直接带进终端和本地项目环境
Gemini CLI 可以直接在终端中调用 Gemini,处理代码理解、任务自动化和工作流构建等需求。同时,它也能结合本地项目上下文使用,让 AI 不只是回答问题,而是围绕代码、命令和文件持续参与具体任务。

适合放进连续的开发流程里使用
采用 reason-and-act 的方式工作,支持结合内置工具以及本地或远程 MCP Server 来完成更复杂的任务,也支持自定义 slash commands。
流程编排
n8n

- GitHub 链接:https://github.com/n8n-io/n8n
- 官网链接:https://n8n.io
- GitHub Star:179k
n8n 是一个工作流自动化平台,把可视化编排、代码扩展和 AI 能力放在同一套工作流体系里。相比只做单点智能体或单一模型接入的工具,它更适合把模型、数据源、外部工具和业务流程连接起来,形成可以持续运行的自动化链路。
核心能力
把 AI 能力接进完整工作流里
n8n 支持用可视化画布搭建工作流,同时保留代码扩展能力,既能满足快速搭建,也能支持更深的定制。它可以连接数据源、AI 模型和外部工具,把业务流程自动化和 AI 工作流放到同一个系统里处理。

AI 真正成为流程系统的一部分
n8n 已经提供 AI Agent、AI Workflow Builder、Chat Hub 等能力,不只是把模型接进流程里,还能继续把多步骤任务、工具调用和交互入口组织成更完整的自动化体系。它更接近团队和业务场景,也更适合让 AI 真正成为流程系统里的一部分。
Dify

- GitHub 链接:https://github.com/langgenius/dify
- 官网链接:https://dify.ai
- GitHub Star:132k
Dify 是一个面向大模型应用开发的开源平台,把 AI 工作流、RAG、智能体能力、模型管理和应用观测放在同一套产品体系里。相比更偏自动化工具的产品,它更贴近 AI 应用本身的搭建过程,重点放在从原型到生产环境这一整条链路上。
核心能力
可视化 AI 工作流搭建
Dify 提供可视化工作流画布,可以直接搭建和测试 AI 工作流,也支持接入大量闭源和开源模型,以及兼容 OpenAI API 的模型服务。对开发者和团队来说,这意味着很多 AI 应用不需要从底层反复拼装,就可以先把整体链路跑起来。

模型、RAG 与应用观测的一体化能力
Dify 内置了完整的 RAG 能力、智能体工具能力和应用日志分析能力,不只是帮助把应用快速搭起来,也方便继续做调试、优化和上线后的维护。它更像是把 AI 应用开发和后续运营放到一个统一平台里处理,而不是拆成多套工具分别完成。
LangChain

- GitHub 链接:https://github.com/langchain-ai/langchain
- 官网链接:https://www.langchain.com
- GitHub Star:129k
LangChain 是一个面向大模型应用和智能体开发的开源框架,核心方向是把模型、工具、上下文和外部集成连接起来。相比更偏可视化工作流的平台,它更接近开发框架本身,适合用来搭建可控性更高、可定制程度更深的 AI 应用。
核心能力
组件化链路组织能力
LangChain 提供了大量可复用组件和第三方集成能力,方便把模型、工具、记忆和外部服务串成一条完整链路。对开发者来说,这种组件化方式最大的价值在于,不需要从零开始搭每一个环节,可以更快地把应用结构组织起来。

面向复杂智能体的编排基础
LangChain 可以快速搭建智能体,也能和 LangGraph 配合,继续往长流程、状态化和可控编排的方向延伸。再加上 LangSmith、Deep Agents 等配套模块,它已经逐渐成为一套围绕 AI 应用和智能体系统展开的基础骨架。
数据与上下文
RAGFlow

- GitHub 链接:https://github.com/infiniflow/ragflow
- 官网链接:https://ragflow.io
- GitHub Star:74.7k
RAGFlow 是一个开源 RAG 引擎,核心方向是为大模型提供更可靠的上下文层,专注于把文档解析、数据清洗、检索增强和 Agent 能力放在同一套体系里。
核心能力
文档解析与数据预处理能力
RAGFlow 提供了内置的数据摄取和处理能力,可以清洗、解析多种格式的数据,并把它们整理成更适合检索和调用的语义表示。对于文档类型复杂、数据来源分散的场景来说,这一步其实很关键,因为上下文质量往往就决定了后面的回答质量。

围绕上下文构建完整的 RAG 链路
RAGFlow 支持基于文档理解的 RAG 能力,能够围绕复杂格式数据建立更可靠的问答和引用链路。同时,它也具备 Agent 平台和可编排的数据流能力,已经加入了工作流画布、Agent 节点和相关 API,更适合继续往企业级知识处理和复杂应用场景延伸。

Firecrawl

- GitHub 链接:https://github.com/firecrawl/firecrawl
- 官网链接:https://www.firecrawl.dev
- GitHub Star:91k
Firecrawl 是一个面向 AI 的网页数据接口,核心能力是把网站内容抓取、爬取并转换成适合大模型使用的结构化数据或 Markdown。相比传统爬虫工具,它更直接服务于 AI 应用和智能体场景,重点不在“把网页抓下来”,而在于把网页变成模型可用的上下文。
核心能力
网页抓取与结构化提取能力
Firecrawl 支持抓取、爬取、提取和搜索网站内容,并输出 Markdown、JSON、链接、截图、HTML 等多种格式。对 AI 应用来说,这一步的价值不只是拿到网页内容,而是能直接得到更适合模型处理的数据形态。

面向大模型应用的数据接入能力
Firecrawl 可以把整站内容整理成适合大模型调用的数据,也已经提供了 MCP Server、SDK 和示例项目,方便继续接入 Cursor、Claude 以及更多开发环境。它更适合那些需要接入外部网站信息、构建实时知识来源或增强检索能力的应用。
Supabase

- GitHub 链接:https://github.com/supabase/supabase
- 官网链接:https://supabase.com
- GitHub Star:98.9k
Supabase 是一个基于 Postgres 的开发平台,把数据库、认证、即时 API、Edge Functions、存储和向量能力放在同一套体系里。放在这篇文章里,它更值得关注的地方不只是“后端平台”这个身份,而是已经把向量、嵌入和 AI 应用需要的数据能力直接纳入了产品主线。
核心能力
一体化的数据与应用底座
Supabase 提供完整的 Postgres 数据库、认证、API、实时能力、Edge Functions 和存储服务,适合直接作为 Web、移动和 AI 应用的底座。对很多团队来说,这意味着数据、权限和应用后端可以放在同一套平台里管理,不需要再额外拆出很多基础设施。

内置向量检索与向量嵌入管理能力
Supabase 已经把 AI 与向量能力直接做进平台里,支持用 Postgres 和 pgvector 存储、索引和查询 embeddings,也支持语义搜索、关键词搜索和混合搜索。同时,它还能结合 Edge Functions、队列、触发器和扩展机制处理向量嵌入的自动生成、更新和重试,更适合承接持续增长的上下文数据和检索需求。
多模态生成
Stable Diffusion WebUI

- GitHub 链接:https://github.com/AUTOMATIC1111/stable-diffusion-webui
- 官网链接:暂无独立官网
- GitHub Star:162k
Stable Diffusion WebUI 是一个基于 Gradio 实现的 Stable Diffusion 网页界面,把本地部署、参数控制和图像生成放到同一个交互入口里。相比更偏节点工作流的工具,它更接近经典的图像生成控制台,适合直接围绕文生图、图生图和模型参数做细致操作。
核心能力
图像生成与编辑能力
Stable Diffusion WebUI 支持文生图和图生图两种核心生成模式,也覆盖局部重绘、画面外扩和图像放大等常见图像生成与编辑能力。对于希望直接围绕提示词、参考图和修图流程做操作的用户来说,这类能力已经足够支撑大部分常见场景。

参数控制和本地扩展
Stable Diffusion WebUI 提供了比较细的参数控制能力,包括采样方法、提示词权重、批量生成、参数回读和多维度参数对比。同时,它也具备相对成熟的本地运行和扩展基础,支持向量嵌入、文本反演等能力,也能结合扩展生态继续丰富功能。
ComfyUI

- GitHub 链接:https://github.com/Comfy-Org/ComfyUI
- 官网链接:https://www.comfy.org/
- GitHub Star:106k
ComfyUI 是一个面向视觉 AI 的可视化工作流工具,核心形态是基于节点和流程图来设计、执行复杂的 Stable Diffusion 流程。相比更像传统控制台式界面的 Stable Diffusion WebUI,它更强调模块化组合、流程复用和复杂生成链路的搭建。
核心能力
基于节点的生成流程编排能力
ComfyUI 支持通过节点、图和流程图界面来搭建复杂的 Stable Diffusion 工作流,很多实验和组合不需要写代码就可以完成。对需要频繁调整提示词、模型、控制条件和生成步骤的用户来说,这种方式会比单次参数调节更灵活。

更适合复用和扩展复杂生成任务
ComfyUI 支持多种图像模型和生成能力,也已经把视频、图像、3D、音频等场景纳入了产品能力范围。同时,它还提供示例工作流、桌面应用和完整文档,方便把生成流程保存、复用,并继续扩展成更复杂的任务链路。
Deep-Live-Cam

- GitHub 链接:https://github.com/hacksider/Deep-Live-Cam
- 官网链接:暂无独立官网
- GitHub Star:80k
Deep-Live-Cam 是一个面向实时视频处理的开源项目,核心能力是实时换脸和一键式视频处理。相比更偏图像生成或流程编排的多模态工具,它更直接把生成式能力放进摄像头、直播和视频内容处理链路里,重点就在“实时可用”这件事上。
核心能力
实时视频生成人脸替换能力
Deep-Live-Cam 支持实时换脸,也支持一键式视频处理,重点放在视频和直播场景下的即时效果。它可以直接把生成能力作用在视频流上,而不是停留在静态图片生成或后期编辑阶段。

摄像头接入与本地运行能力
Deep-Live-Cam 可以直接结合摄像头输入使用,也支持对现有视频内容进行处理。同时,它提供了本地部署方式,并围绕 GPU、推理依赖和运行环境给出了较完整的安装说明,方便把这类能力直接跑在自己的设备环境里。

结语
如果说 OpenClaw 让更多人看到了 AI 在个人场景下的执行能力,那么过去几个月的市场变化也说明,这类能力已经不再停留在个人工具层面。
无论是地方围绕 OpenClaw 推动产业生态,还是厂商快速基于它做产品化封装,比如 Kimi Claw、MaxClaw、QClaw 等,热门 AI 工具一旦走向更复杂的应用环境,最终都会继续往企业和行业场景延伸。而企业需要的,不只是一个会对话、会调用工具的智能体,而是一套能接入数据、嵌入流程、限制权限、支持协作的系统环境。
如果你想了解 AI 如何真正进入业务系统、参与真实业务流程,也可以前往 NocoBase 官网进一步了解我们在 AI 员工能力和业务系统搭建上的相关实践。
相关阅读: