技术深度
多层 PII 栈 · 双协议桥接 · argus-redact 核心开源
所有核心能力可验证、可审计、可 pip install
L1 Regex · L1b 证据评分 · L2 NER · 中文 PII 深度覆盖
fast mode, p99 < 5ms · 身份证(18 位 + 校验位)/ 银行卡(Luhn)/ 手机 / 邮箱 / 地址 / 港澳台证件 / 企业统一社会信用代码 等 32+ 类中文 PII
实现:argus-redact _core.so(PyO3 Rust 编译,2.6MB)
±20 字符上下文窗口 · 识别"这是真的身份证号"还是"看起来像身份证号的随机数字"
阈值过滤误判 · 提升 precision,减少 false positive
开放词汇 PII:中文姓名 / 组织名 / 地名 · Regex 覆盖不到的部分
中文 NER 模型 · 可选启用
Anthropic Messages API + OpenAI chat/completions 同时原生支持
Red Hat 模式 · 开源核心 + 商业 gateway · 无 vendor lock
pip install 验证Apache 2.0 Rust + PyO3 0.4.14+ 32+ 类中文 PII
argus-redact 是 Argus Gateway 的 PII 识别与脱敏核心,完全开源在 github.com/wan9yu/argus-redact。 评估 Argus Gateway 时你可以:
· 独立 clone + run benchmark 验证中文 PII 识别率
· 审计核心算法实现,不依赖营销 claim
· Fork + 自维,Apache 2.0 允许企业自用 / 二开
Red Hat 商业模型:核心开源建立信任,商业 gateway 层(admin UI / 审计 / 合规证据链 / agent 治理 / 多协议桥接 / 私有云)作为企业版。 既有开源的可审计性,也有企业级的开箱能力。
→ github.com/wan9yu/argus-redact