自进化模式库

高级 · 自适应检测

自动从生产事件提取并演进攻击模式¶

自动从高风险生产事件中提取候选攻击模式，并通过算子反馈驱动其经历四阶段生命周期，随时间推移不断扩充检测规则集。

实验性功能默认关闭环境变量开关四阶段生命周期

概述¶

当 L1 或 L2 将某事件分类为高风险时，PatternEvolutionManager.extract_candidate() 会将触发命令清洗为可复用的正则表达式，并以 CANDIDATE 状态存储。算子通过 REST API 确认或拒绝候选模式，系统则根据反馈计数和五因子置信度分数自动晋升或废弃模式。

默认关闭

模式演进由 CS_EVOLVING_ENABLED（默认 false）控制。在设置该标志前，不会发生任何候选提取或存储写入。若未配置 CS_EVOLVED_PATTERNS_PATH，启用该标志将在启动时抛出 ValueError。

`EvolvedPattern` 结构¶

EvolvedPattern 是 AttackPattern 的子类，继承其所有触发/检测/FP 过滤字段。附加的生命周期字段如下：

字段	类型	默认值	说明
`status`	`PatternStatus`	`CANDIDATE`	生命周期阶段（见下文）
`confidence`	`float`	`0.0`	计算所得 0.0–1.0 分值；晋升 STABLE 需达到 ≥ 0.70
`source_framework`	`str`	`""`	触发事件所属框架（如 `a3s-code`、`openclaw`）
`confirmed_count`	`int`	`0`	算子确认次数
`false_positive_count`	`int`	`0`	算子误报拒绝次数
`created_at`	`str`	UTC ISO-8601	提取时设置的时间戳
`last_triggered_at`	`str \\| None`	`None`	最近一次触发的 ISO-8601 时间戳；用于时效性评分

is_active 属性仅在 status 为 EXPERIMENTAL 或 STABLE 时返回 True。PatternMatcher 将此作为将演进模式纳入实时检测的唯一判断条件。

模式生命周期¶

stateDiagram-v2
    [*] --> CANDIDATE : extract_candidate()

    CANDIDATE --> EXPERIMENTAL : 首次确认（confirmed=true）
    EXPERIMENTAL --> STABLE : confirmed_count ≥ 3\n且 confidence ≥ 0.70

    CANDIDATE --> DEPRECATED : FP rate > 30%\n且 total ≥ 3
    EXPERIMENTAL --> DEPRECATED : FP rate > 30%\n且 total ≥ 3
    STABLE --> DEPRECATED : FP rate > 30%\n且 total ≥ 3

    DEPRECATED --> [*]

    note right of STABLE
        STABLE/EXPERIMENTAL 不可回退至 CANDIDATE。
        若需撤销，须手动删除模式并重新提取。
    end note

状态值¶

状态	值	参与检测	含义
`CANDIDATE`	`"candidate"`	否	刚提取；等待算子首次审核
`EXPERIMENTAL`	`"experimental"`	是	至少一次确认；在 L2 匹配中激活
`STABLE`	`"stable"`	是	≥ 3 次确认且置信度 ≥ 0.70；视为可靠
`DEPRECATED`	`"deprecated"`	否	误报率超出阈值或模式被丢弃

转换规则（`promote_pattern()` 按优先级顺序评估）¶

所有转换均由对 PatternEvolutionManager.confirm() 的调用触发。

flowchart TD
    A([调用 confirm\npattern_id, confirmed]) --> B{CS_EVOLVING_ENABLED?}
    B -- 否 --> Z1([返回 &quot;disabled&quot;])
    B -- 是 --> C{模式存在?}
    C -- 否 --> Z2([返回 &quot;not_found&quot;])
    C -- 是 --> D{confirmed = false?}
    D -- 是 --> E[记录 FP\nfalse_positive_count++]
    E --> F{total ≥ 3\n且 fp_rate > 30%?}
    F -- 是 --> G([返回 &quot;deprecated_high_fp&quot;\n状态 → DEPRECATED])
    F -- 否 --> H([返回 &quot;fp_recorded&quot;])
    D -- 否 --> I[confirmed_count++]
    I --> J{total ≥ 3\n且 fp_rate > 30%?}
    J -- 是 --> G
    J -- 否 --> K{当前状态?}
    K -- CANDIDATE --> L([返回 &quot;promoted_to_experimental&quot;\n状态 → EXPERIMENTAL])
    K -- EXPERIMENTAL --> M{confirmed_count ≥ 3\n且 confidence ≥ 0.70?}
    M -- 是 --> N([返回 &quot;promoted_to_stable&quot;\n状态 → STABLE])
    M -- 否 --> O([返回 &quot;confirmed&quot;\n保持 EXPERIMENTAL])
    K -- STABLE --> P([返回 &quot;confirmed&quot;\n幂等，无状态变更])

规则 1 — FP 废弃（最高优先级）：

适用于任意状态。若 total = confirmed_count + false_positive_count ≥ 3 且 false_positive_count / total > 0.30，则模式立即设为 DEPRECATED，忽略其他条件。返回 "deprecated_high_fp"。

规则 2 — CANDIDATE → EXPERIMENTAL：

由对 CANDIDATE 模式的任意 confirmed=True 调用触发（FP 检查通过后）。返回 "promoted_to_experimental"。

规则 3 — EXPERIMENTAL → STABLE：

由对 EXPERIMENTAL 模式的 confirmed=True 调用触发，且同时满足以下两个条件：

confirmed_count ≥ 3
compute_confidence(...) ≥ 0.70

返回 "promoted_to_stable"。若计数满足但置信度不足，模式保持 EXPERIMENTAL 状态并返回 "confirmed"。

STABLE → STABLE： 进一步确认返回 "confirmed"，不改变状态。

`confirm()` 的返回值¶

返回值	触发条件
`"disabled"`	`CS_EVOLVING_ENABLED` 为 false
`"not_found"`	`pattern_id` 不存在于存储中
`"deprecated_high_fp"`	FP 率超出阈值
`"promoted_to_experimental"`	CANDIDATE 的首次确认
`"promoted_to_stable"`	EXPERIMENTAL 满足计数 + 置信度阈值
`"confirmed"`	已确认但未晋升（计数/置信度尚未满足，或已为 STABLE）
`"fp_recorded"`	FP 已记录；total < 3 或 fp_rate ≤ 30%——不废弃

置信度评分¶

compute_confidence() 返回 0.0–1.0 分值，用作 STABLE 晋升的阈值判断。计算公式：

confidence = 0.30 × R_confirm + 0.20 × R_frequency + 0.20 × R_cross_fw + 0.20 × R_accuracy + 0.10 × R_recency

因子	权重	变量	计算方法
确认比率	30%	`R_confirm`	`confirmed_count / max(total, 1)`
触发频率	20%	`R_frequency`	`min(trigger_count / 10.0, 1.0)` — 10 次触发后饱和
跨框架加成	20%	`R_cross_fw`	`min((framework_count - 1) / 2.0, 1.0)` — 1 个来源为 0.0，2 个为 0.5，3+ 个为 1.0
准确率	20%	`R_accuracy`	`1.0 - fp_rate`
时效性	10%	`R_recency`	见下表

基于 days_since_last_trigger 的时效衰减：

距上次触发天数	`R_recency`
≤ 7	1.0
≤ 30	0.5
> 30	0.2

promote_pattern() 如何调用 compute_confidence()

在评估 EXPERIMENTAL → STABLE 时，promote_pattern() 传入 framework_count=1 和 days_since_last=0（假设为最近触发）。因此内部晋升检查不使用跨框架评分；该因子仅用于外部报告或自定义晋升逻辑。

候选模式提取¶

当演进功能启用时，PatternEvolutionManager.extract_candidate() 由 Gateway 在每次高风险事件时自动调用。

去重¶

工具名和命令以 "{tool_name}:{command}" 格式组合，经 SHA-256 哈希后取前 16 个十六进制字符作为去重键。相同命令始终映射到相同的模式 ID——EV-{前 8 个十六进制字符，大写}。重复调用返回已有 ID，不创建新模式。

类别推断（`_infer_category()`）¶

类别按优先级顺序解析：

ASI 原因代码（最高优先级）：

reasons 中的代码类别

ASI01 goal_hijack

ASI02 data_exfiltration

ASI03 privilege_abuse

ASI04 supply_chain

ASI05 code_execution
命令关键字兜底：

关键字类别

curl, wget, nc, ncat data_exfiltration

sudo, chmod, chown privilege_abuse

eval, exec, python -c, bash -c code_execution
无匹配时返回 "unknown"。

正则清洗（`_sanitize_for_regex()`）¶

命令中的具体值被替换为通用占位符，生成可复用的检测正则：

原始 token 类型	替换内容
HTTP/HTTPS URL	`https?://\S+`
IPv4 地址	`\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}`
文件路径（`/…`）	`[\w./-]+`

其余 shell 元字符均经 re.escape() 转义。清洗后的模式以权重 6 存储于 detection.regex_patterns 字段。

与基础模式的集成¶

pattern_matcher.py 中的 load_patterns() 是核心模式与演进模式的合并点：

核心模式 始终从内置的 attack_patterns.yaml（≥ 25 条模式）加载。
演进模式 在提供 evolved_path 时追加，需通过两项过滤：
- is_active 必须为 True（状态为 EXPERIMENTAL 或 STABLE）。
- 模式 ID 不得与核心模式 ID 冲突。冲突将记录警告并跳过。

PatternMatcher.reload() 在不重启进程的情况下重新从磁盘读取两个文件，使演进决策立即生效。

ID 命名空间

演进模式使用 EV- 前缀以避免与内置 ASI* ID 冲突。请勿在核心 YAML 中手动创建带有 EV- 前缀的模式。

存储持久化¶

EvolvedPatternStore 使用原子性的 tempfile + os.replace 序列将模式写入 YAML 文件，防止失败时数据损坏。文件格式：

version: "1.0"
evolved: true
patterns:
  - id: EV-A3F8B2C1
    status: experimental
    confidence: 0.72
    confirmed_count: 2
    false_positive_count: 0
    ...

达到 `max_patterns` 上限时的驱逐策略¶

当存储达到上限（max_patterns，默认 500）时，在添加新模式前会驱逐一条旧模式：

驱逐最旧的 DEPRECATED 模式（按 created_at 升序）。
若无，则驱逐最旧的 CANDIDATE 模式。
若所有模式均为 EXPERIMENTAL 或 STABLE，add() 返回 False，候选模式被丢弃。

EXPERIMENTAL 和 STABLE 模式永不被驱逐

只有 DEPRECATED 和 CANDIDATE 模式可被驱逐。模式一旦达到 EXPERIMENTAL 或 STABLE，无论存储压力多大都会被保留。

配置¶

环境变量	类型	默认值	说明
`CS_EVOLVING_ENABLED`	bool	`false`	设为 `1`、`true` 或 `yes`（大小写不敏感）以激活提取和 API 写入
`CS_EVOLVED_PATTERNS_PATH`	string	—	演进 YAML 文件的绝对路径；`CS_EVOLVING_ENABLED=true` 时必填

PatternEvolutionManager 构造函数参数：

参数	类型	默认值	说明
`store_path`	`str`	—	对应 `CS_EVOLVED_PATTERNS_PATH`
`enabled`	`bool`	`False`	对应 `CS_EVOLVING_ENABLED`
`max_patterns`	`int`	`500`	存储模式数量的硬上限

空 store_path 在启动时报错

传入 enabled=True 且 store_path 为空或仅含空白字符时，立即抛出 ValueError。启用前请验证 CS_EVOLVED_PATTERNS_PATH 已正确设置。

REST API¶

所有端点均需 Bearer token（CS_AUTH_TOKEN）。

`GET /ahp/patterns`¶

返回存储中的所有演进模式（所有状态）。CS_EVOLVING_ENABLED 为 false 时返回空 patterns 列表。

响应字段： enabled、store_path、count、active_count、candidate_count、patterns（模式对象数组，含 id、category、description、risk_level、status、confidence、source_framework、confirmed_count、false_positive_count、created_at）。

`POST /ahp/patterns/confirm`¶

通过算子反馈驱动状态转换。每次调用后自动持久化到磁盘。

请求体：

{ "pattern_id": "EV-A3F8B2C1", "confirmed": true }

字段	类型	必填	说明
`pattern_id`	`string`	是	`EV-XXXXXXXX` 格式的模式 ID
`confirmed`	`boolean`	是	`true` = 真实攻击；`false` = 误报。必须为 JSON 布尔值——字符串 `"true"` 返回 HTTP 400

HTTP 状态码：

代码	条件
200	成功；响应体包含 `{"result": "…", "pattern_id": "…"}`
400	请求字段缺失或无效
403	演进功能已禁用
404	`pattern_id` 不存在于存储中

result 值： promoted_to_experimental、promoted_to_stable、confirmed、fp_recorded、deprecated_high_fp。

快速入门¶

环境变量.env 文件

export CS_EVOLVING_ENABLED=true
export CS_EVOLVED_PATTERNS_PATH=/var/lib/clawsentry/evolved_patterns.yaml
clawsentry-gateway

CS_EVOLVING_ENABLED=true
CS_EVOLVED_PATTERNS_PATH=/var/lib/clawsentry/evolved_patterns.yaml

Gateway 处理一定流量后，查询候选模式：

curl http://localhost:8080/ahp/patterns \
  -H "Authorization: Bearer $CS_AUTH_TOKEN" | jq '.patterns[] | select(.status=="candidate")'

将候选模式确认为真实攻击：

curl -s -X POST http://localhost:8080/ahp/patterns/confirm \
  -H "Authorization: Bearer $CS_AUTH_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"pattern_id": "EV-A3F8B2C1", "confirmed": true}'

代码位置¶

模块	路径	职责
演进核心	`src/clawsentry/gateway/pattern_evolution.py`	`EvolvedPattern`、`EvolvedPatternStore`、`compute_confidence()`、`promote_pattern()`、`PatternEvolutionManager`
模式加载/匹配	`src/clawsentry/gateway/pattern_matcher.py`	`load_patterns()` 双源合并、`is_active` 过滤、`PatternMatcher.reload()`
内置规则集	`src/clawsentry/gateway/attack_patterns.yaml`	核心模式（≥ 25 条）；不由演进功能管理
配置集成	`src/clawsentry/gateway/detection_config.py`	`evolving_enabled` + `evolved_patterns_path` 字段
REST API	`src/clawsentry/gateway/server.py`	`GET /ahp/patterns`、`POST /ahp/patterns/confirm`

`reasons` 中的代码	类别
`ASI01`	`goal_hijack`
`ASI02`	`data_exfiltration`
`ASI03`	`privilege_abuse`
`ASI04`	`supply_chain`
`ASI05`	`code_execution`

关键字	类别
`curl`, `wget`, `nc`, `ncat`	`data_exfiltration`
`sudo`, `chmod`, `chown`	`privilege_abuse`
`eval`, `exec`, `python -c`, `bash -c`	`code_execution`

自进化模式库

自动从生产事件提取并演进攻击模式¶

概述¶

EvolvedPattern 结构¶

模式生命周期¶

状态值¶

转换规则（promote_pattern() 按优先级顺序评估）¶

confirm() 的返回值¶