Strix:开源的 AI 渗透测试 Agent,登上 GitHub Trending 第一

一句话推荐:当 ChatGPT、Cursor 这些 AI 工具帮开发者以 10× 速度写代码时,谁来帮我们以同样的速度发现这些代码里的安全漏洞?Strix 给出了一个让人眼前一亮的答案 —— 一群能” 真动手” 的 AI 黑客 Agent。

一、当 AI 写代码的速度跑赢了安全审计

想象一个场景:你刚用 Cursor 写完一个新接口,10 分钟搞定,自动部署上去了。但你心里其实有点慌 ——SQL 拼接、IDOR、SSRF 这些东西,你真的都检查了吗?

过去,你有两个选择:要么花钱找安全团队人工测,周期长到几周、报价动不动 5 万美元起步;要么靠 Snyk 这类 SAST 工具静态扫一遍,告警多如牛毛,真正能复现的高危却没几条 —— 开发看着满屏红一片,要么麻木要么摆烂。

有没有第三种选择?

Strix —— 一个在 GitHub Trending 上冲到第一的开源项目(单日新增 2,800+ Star,总 Star 已经破 34k),定位很激进:“Open-source AI hackers to find and fix your app’s vulnerabilities.”

它不是又一个 SAST 工具,也不是又一个代码审计 Copilot。它做的事更接近” 一个不知疲倦、不会出错、随时能拉起来干活的渗透测试团队”。

二、Strix 是什么?解决的到底是什么问题?

Strix 的官网是 strix.ai,仓库在 github.com/usestrix/strix,协议 Apache 2.0。它由一群安全研究者和 AI Agent 工程师共同打造,核心定位是:

用自主 AI Agent 模拟真实黑客的思路,动态执行代码、识别漏洞、并通过真正的 PoC(Proof of Concept)去验证它 —— 最后只把确认能复现的问题交给你。

它和传统 SAST 的关键区别,可以用一张图概括:

维度 传统 SAST(Snyk/CodeQL 等) Strix
分析方式 静态扫描代码模式 动态执行 + 真实攻击
漏洞验证 模式匹配,误报率高 用 PoC 实际跑一遍
业务逻辑漏洞 几乎检测不到 能跑通完整攻击链
报告 一堆” 可能有问题” 的告警 真正能复现的漏洞 + 证据
适用阶段 CI/CD 卡点 提交前 + PR + 预发

简单一句话:SAST 给你的是” 嫌疑犯名单”,Strix 给你的是” 已经定罪并留下指纹的犯罪现场报告”。

三、核心功能亮点

Strix 的设计哲学不是” 再做一个 LLM 套壳”,而是一套完整的 Agentic Security 系统。这里挑五个最值得说的亮点:

1. Graph of Agents:会协作的 AI 黑客团队

Strix 不是单个 Agent 单打独斗,而是构建了一张 Agent 图(Graph of Agents)

  • Reconnaissance Agent(侦察):像 Nmap 一样先摸清你的应用拓扑、API 端点、技术栈。
  • Vulnerability Analysis Agent(漏洞分析):基于侦察结果,针对性测试 OWASP Top 10、业务逻辑漏洞。
  • Exploitation Agent(漏洞利用):拿到可疑点后,真的去构造请求、打过去,把数据库 dump 下来或者弹出 XSS。
  • Reporting Agent(报告):把整个攻击链路整理成结构化报告 + 修复建议。

这些 Agent 共享上下文、协同决策,最终输出的是” 完整攻击链”,而不是” 这一行代码看着不安全”。

2. PoC-First:每个漏洞都有真凭实据

Strix 最狠的地方是 强制 PoC 验证 —— 它不会报告” 这里可能存在 SQL 注入”,而是真的会:

  1. 构造 payload
  2. 发请求
  3. 看响应里是否真的出现数据库报错、字段值被替换、或者被拖库

如果复现不了,它就当没看见。这意味着你看到的报告里没有” 疑似” 两个字 —— 要么确认能打,要么不报。对开发者极其友好。

3. 动态执行,不是静态扫描

传统 SAST 看的是源码字符串,Strix 跑的是真实 HTTP 请求、真实浏览器操作、真实 SQL 查询。它的工具箱里整合了:

  • Playwright(浏览器自动化)
  • Caido(下一代 Web 安全测试代理)
  • Nuclei(漏洞模板库,ProjectDiscovery 出品)
  • Textual(交互式 TUI 框架)

基于这些工具,Strix 能模拟真实攻击者的完整链路 —— 从信息收集到权限提升,一条龙。

4. CI/CD 原生集成:把安全卡在 PR 阶段

Strix 对 DevSecOps 工作流的支持不是后补的:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# .github/workflows/strix.yml
name: Strix Security Scan
on: pull_request
jobs:
security:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
with:
fetch-depth: 0 # 关键:Strix 需要完整 git 历史来 diff scope
- name: Run Strix
run: |
pip install strix-agent
strix -n --diff-base origin/main

注意 -n 是 non-interactive 模式,专为 CI/CD 设计。扫描发现漏洞时 exit code 非零,直接卡住 PR 合并。

它还会在 PR 模式下自动 scope 到改动文件,让 PR 阶段扫描从 30 分钟压到几分钟。

5. 多 LLM 灵活切换,不绑死一家

Strix 通过 LiteLLM 支持几乎所有主流模型:

  • OpenAI gpt-5.4
  • Anthropic claude-sonnet-4-6
  • Vertex AI gemini-3-pro-preview
  • Bedrock、Azure、本地模型(Ollama)

推荐用 GPT-5.4 或 Claude Sonnet 4.6 这种 reasoning 能力强的模型,但本地模型也能跑(牺牲一些深度,换来数据不出网)。

四、实战示例:5 分钟跑起来

安装

1
2
3
4
5
# 推荐用 uv(现代化 Python 包管理)
pip install strix-agent

# 第一次运行会自动拉 Docker 沙箱镜像
strix --target http://localhost:3000

交互式扫描

1
2
3
# 启动后进入 TUI(基于 Textual)
# 输入目标应用 URL,比如你的 staging 环境
strix --target https://staging.myapp.com

Agent 会立刻开始侦察、列端点、跑 PoC。TUI 里你能实时看到 Agent 的行动轨迹 —— 像看一部黑客电影。

非交互模式(CI 用)

1
2
3
4
5
# 跑完直接出报告,适合 CI
strix -n --target https://staging.myapp.com

# 只扫描 PR 改动文件(关键加速)
strix -n --target https://staging.myapp.com --diff-base origin/main

结果保存在 strix_runs/<run-name>/,结构非常清晰:

1
2
3
4
5
6
7
8
9
strix_runs/
└── 2026-07-04_我的应用渗透测试/
├── report.md # 人类可读报告
├── findings.json # 结构化漏洞清单
├── poc/ # 每个漏洞的 PoC 脚本
│ ├── sqli_user_login.py
│ ├── idor_order_access.py
│ └── ssrf_metadata_api.py
└── agent_logs/ # Agent 决策日志,可审计

配置 LLM

首次运行时会问你 API key,写到 ~/.strix/cli-config.json,下次就不用再填了:

1
2
3
export OPENAI_API_KEY=sk-...
# 或者
export ANTHROPIC_API_KEY=sk-ant-...

GitHub Actions 完整示例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
name: Security Scan
on:
pull_request:
branches: [main]
schedule:
- cron: '0 2 * * *' # 每天凌晨 2 点全量扫一次

jobs:
strix:
runs-on: ubuntu-latest
permissions:
contents: read
pull-requests: write # 想自动评论就开这个
steps:
- uses: actions/checkout@v4
with:
fetch-depth: 0

- name: Setup Python
uses: actions/setup-python@v5
with:
python-version: '3.11'

- name: Install Strix
run: pip install strix-agent

- name: Run Strix
env:
OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
run: strix -n --target ${{ secrets.STAGING_URL }}

五、适用场景和限制

✅ Strix 最适合

  • 快速 MVP / 内部工具:上生产前没有安全预算,至少跑一遍 Strix。
  • 定期回归扫描:CI 里每天定时跑,防新引入的漏洞。
  • Bug Bounty 备战:用 Strix 先把低垂的果实薅完。
  • 安全教学:观察 Agent 的攻击路径,比看 OWASP 文档直观 100 倍。
  • 多 Agent 协同研究:Graph of Agents 的设计本身就是 Agentic 工程的好样本。

⚠️ Strix 不擅长 / 当前限制

  • 扫描真实生产环境有风险:PoC 验证会真实修改数据、跑 SQL、触发限流,一定要在 staging 环境跑
  • 超大代码库:一个 10w+ 行的单体应用,全量扫描时间和 token 消耗都不小(用 --diff-base 能缓解)。
  • 极度依赖 LLM 推理能力:用本地小模型,复杂业务逻辑漏洞基本抓不到。
  • 认证逻辑深度依赖人工配置:登录态、SSO、Cookie 这些需要你手动注入测试 token,Strix 不会帮你绕过登录。
  • 不替代人工红队:Strix 抓不到 0day、APT 级攻击链,但能挡住 80% 的常规漏洞。

六、同类对比:Strix 强在哪?

最近 Escape.tech 做了一份 benchmark(Benchmarking AI Pentesting Tools),横向对比了 4 个 AI 渗透测试工具:

工具 开源 模式 Strix 优势
Escape ❌ 商业 SaaS 全自动黑盒 Strix 开源 + 可私有部署
Shannon ✅ 开源 Agent 编排 Strix PoC 验证更彻底
Strix ✅ 开源 Graph of Agents
PentAGI ✅ 开源 Multi-Agent Strix 报告更工程化

更广义的对比:

  • vs Snyk / GitGuardian / CodeQL:它们是 SAST/SCA,看代码模式;Strix 是 DAST + 真实攻击,完全互补。
  • vs Burp Suite Pro:Burp 是工具集合,需要人操作;Strix 是 AI 自己跑。
  • vs 人工红队:红队每次 5w+ 美元、几周时间;Strix 几美元一次、几小时搞定。

七、总结:AI 安全工具的新范式

Strix 让我兴奋的不是它今天能抓多少漏洞,而是它代表的范式转变:

过去的工具告诉你” 代码看着有问题”;新一代 Agent 工具告诉你” 问题真的存在,并且我能证明给你看”。

对一个开发者来说,这意味着:

  1. 安全不再是上线前的” 卡点”,而是开发循环的一部分
  2. 报告里没有” 疑似”,每一条都带 PoC,可以直接复现
  3. 开源 + 自部署 + 多模型,不用担心数据出网,也不用担心被 SaaS 绑死。

如果你今天就要选一件事做,那很简单:

1
2
pip install strix-agent
strix --target http://localhost:3000

让一群不知疲倦的 AI 黑客,今晚就把你代码里的洞给你翻个底朝天。


项目地址github.com/usestrix/strix
官网strix.ai
文档docs.strix.ai
协议:Apache 2.0