Merge pull request #14 from dreadnode/fix/airt-agent-goal-categories-1.3.1

rdheekonda · web-flow · commit 4a3e79b4ef8a · 2026-05-14T14:24:00.000-07:00
docs(airt): expand goal_category list in agent prompt (1.3.1)
diff --git a/capabilities/ai-red-teaming/agents/ai-red-teaming-agent.md b/capabilities/ai-red-teaming/agents/ai-red-teaming-agent.md
@@ -204,7 +204,7 @@ The capability ships 41 LLM attack algorithms plus 4 adversarial ML samplers; th
 | compare_transforms | No | true = N+1 study (baseline + each transform individually) |
 | scorers | No | Additional scorers (see scorer catalog below) |
 | n_iterations | No | Max iterations (defaults vary by attack) |
-| goal_category | No | Category: jailbreak, credential_leak, tool_misuse, system_prompt_leak, harmful_content, pii, refusal_bypass, bias, content_policy |
+| goal_category | No | Canonical slug. Core: `jailbreak_general`, `credential_leak`, `tool_misuse`, `system_prompt_leak`, `harmful_content`, `pii_extraction`, `refusal_bypass`, `bias_fairness`, `content_policy`. Extended: `reasoning_exploitation`, `supply_chain`, `resource_exhaustion`, `quantization_safety`, `alignment_integrity`, `multi_turn_escalation`. Short aliases (e.g. `pii`, `bias`, `jailbreak`) also resolve. |
 | assessment_name | No | Name for assessment tracking |
 
 ## Transform Catalog
diff --git a/capabilities/ai-red-teaming/capability.yaml b/capabilities/ai-red-teaming/capability.yaml
@@ -1,6 +1,6 @@
 schema: 1
 name: ai-red-teaming
-version: "1.3.0"
+version: "1.3.1"
 description: >
   Probe the security and safety of AI applications, agents, and foundation models.
   Orchestrates adversarial attack workflows to discover vulnerabilities in LLMs,