braintrustdata · Luca Forstner (lforst) · May 4, 2026 · Apr 20, 2026 · Apr 21, 2026 · Apr 21, 2026
diff --git a/.agents/skills/e2e-tests/SKILL.md b/.agents/skills/e2e-tests/SKILL.md
@@ -45,6 +45,7 @@ Try not to use specific test narrowing commands unless hunting down a very nasty
 - Keep reusable logic in `e2e/helpers/`. Keep one-off fixtures and scenario-specific files inside the scenario directory.
 - Snapshot stable contracts, not raw noise. Use `normalizeForSnapshot(...)` before inline snapshots and `formatJsonFileSnapshot(...)` plus file snapshots for larger payloads or version matrices.
 - When a scenario family already has `assertions.ts`, keep version- or provider-specific test setup in `scenario.test.ts` and reuse the shared assertions file.
+- Keep the CI e2e summary up to date. If a scenario version matrix or `variantKey` changes, update `e2e/config/pr-comment-scenarios.json` in the same change and follow the established pattern used by other versioned scenarios: one summary row per version, not separate wrapped/auto rows unless that pattern already exists for the scenario family.
 - Run new or updated scenarios three times in a row before considering snapshots stable.
 
 ## Scenario Patterns

diff --git a/.env.example b/.env.example
@@ -2,7 +2,9 @@ BRAINTRUST_API_KEY=
 OPENAI_API_KEY=
 ANTHROPIC_API_KEY=
 GEMINI_API_KEY=
+CURSOR_API_KEY=
 OPENROUTER_API_KEY=
 MISTRAL_API_KEY=
 HUGGINGFACE_API_KEY=
 COHERE_API_KEY=
+GROQ_API_KEY=
diff --git a/.github/workflows/checks.yaml b/.github/workflows/checks.yaml
@@ -459,7 +459,6 @@ jobs:
       - js-test
       - js-build
       - e2e-hermetic
-      - js-api-compatibility
       - js-smoke-discover
       - js-smoke-test
       - temporal-js
@@ -492,7 +491,6 @@ jobs:
           check_result "js-test" "${{ needs.js-test.result }}"
           check_result "js-build" "${{ needs.js-build.result }}"
           check_result "e2e-hermetic" "${{ needs.e2e-hermetic.result }}"
-          check_result "js-api-compatibility" "${{ needs.js-api-compatibility.result }}"
           check_result "js-smoke-discover" "${{ needs.js-smoke-discover.result }}"
           check_result "js-smoke-test" "${{ needs.js-smoke-test.result }}"
           check_result "temporal-js" "${{ needs.temporal-js.result }}"

diff --git a/.github/workflows/e2e-canary.yaml b/.github/workflows/e2e-canary.yaml
@@ -35,6 +35,8 @@ jobs:
           BRAINTRUST_E2E_PROJECT_NAME: ${{ vars.BRAINTRUST_E2E_PROJECT_NAME }}
           GEMINI_API_KEY: ${{ secrets.GEMINI_API_KEY }}
           COHERE_API_KEY: ${{ secrets.COHERE_API_KEY }}
+          CURSOR_API_KEY: ${{ secrets.CURSOR_API_KEY }}
+          GROQ_API_KEY: ${{ secrets.GROQ_API_KEY }}
           OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
           OPENROUTER_API_KEY: ${{ secrets.OPENROUTER_API_KEY }}
           MISTRAL_API_KEY: ${{ secrets.MISTRAL_API_KEY }}

diff --git a/.github/workflows/integration-tests.yaml b/.github/workflows/integration-tests.yaml
@@ -29,6 +29,7 @@ jobs:
       ANTHROPIC_API_KEY: ${{ secrets.ANTHROPIC_API_KEY }}
       OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
       GEMINI_API_KEY: ${{ secrets.GEMINI_API_KEY }}
+      CURSOR_API_KEY: ${{ secrets.CURSOR_API_KEY }}
       OPENROUTER_API_KEY: ${{ secrets.OPENROUTER_API_KEY }}
       MISTRAL_API_KEY: ${{ secrets.MISTRAL_API_KEY }}
       HUGGINGFACE_API_KEY: ${{ secrets.HUGGINGFACE_API_KEY }}
@@ -58,6 +59,8 @@ jobs:
       ANTHROPIC_API_KEY: ${{ secrets.ANTHROPIC_API_KEY }}
       GEMINI_API_KEY: ${{ secrets.GEMINI_API_KEY }}
       COHERE_API_KEY: ${{ secrets.COHERE_API_KEY }}
+      CURSOR_API_KEY: ${{ secrets.CURSOR_API_KEY }}
+      GROQ_API_KEY: ${{ secrets.GROQ_API_KEY }}
       OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
       OPENROUTER_API_KEY: ${{ secrets.OPENROUTER_API_KEY }}
       MISTRAL_API_KEY: ${{ secrets.MISTRAL_API_KEY }}
@@ -109,6 +112,8 @@ jobs:
       ANTHROPIC_API_KEY: ${{ secrets.ANTHROPIC_API_KEY }}
       GEMINI_API_KEY: ${{ secrets.GEMINI_API_KEY }}
       COHERE_API_KEY: ${{ secrets.COHERE_API_KEY }}
+      CURSOR_API_KEY: ${{ secrets.CURSOR_API_KEY }}
+      GROQ_API_KEY: ${{ secrets.GROQ_API_KEY }}
       OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
       OPENROUTER_API_KEY: ${{ secrets.OPENROUTER_API_KEY }}
       MISTRAL_API_KEY: ${{ secrets.MISTRAL_API_KEY }}

diff --git a/.github/workflows/prepare-js-release.yaml b/.github/workflows/prepare-js-release.yaml
@@ -54,6 +54,8 @@ jobs:
             echo "release_branch=$release_branch"
           } >> "$GITHUB_OUTPUT"
       - name: Run changeset version
+        env:
+          GITHUB_TOKEN: ${{ github.token }}
         run: pnpm exec changeset version
       - name: Create release commit
         run: |

diff --git a/e2e/README.md b/e2e/README.md
@@ -115,10 +115,12 @@ Non-hermetic scenarios require provider credentials in addition to the mock Brai
 - `OPENAI_API_KEY`
 - `ANTHROPIC_API_KEY`
 - `GEMINI_API_KEY` or `GOOGLE_API_KEY`
+- `CURSOR_API_KEY`
 - `OPENROUTER_API_KEY`
 - `MISTRAL_API_KEY`
 - `HUGGINGFACE_API_KEY`
 - `COHERE_API_KEY`
+- `GROQ_API_KEY`
 
 `claude-agent-sdk-instrumentation` also uses `ANTHROPIC_API_KEY`, because it runs the real Claude Agent SDK against Anthropic in the same style as the existing live Anthropic wrapper coverage.
 

diff --git a/e2e/config/pr-comment-scenarios.json b/e2e/config/pr-comment-scenarios.json
@@ -26,7 +26,10 @@
     "scenarioDirName": "google-adk-instrumentation",
     "label": "Google ADK Instrumentation",
     "metadataScenario": "google-adk-instrumentation",
-    "variants": [{ "variantKey": "google-adk-v061", "label": "v0.6.1" }]
+    "variants": [
+      { "variantKey": "google-adk-v061", "label": "v0.6.1" },
+      { "variantKey": "google-adk-v1000", "label": "v1.0.0" }
+    ]
   },
   {
     "scenarioDirName": "google-genai-instrumentation",
@@ -39,6 +42,15 @@
       { "variantKey": "google-genai-v1460", "label": "v1.46.0" }
     ]
   },
+  {
+    "scenarioDirName": "groq-instrumentation",
+    "label": "Groq Instrumentation",
+    "metadataScenario": "groq-instrumentation",
+    "variants": [
+      { "variantKey": "groq-v1-wrapped", "label": "Wrapped" },
+      { "variantKey": "groq-v1-auto", "label": "Auto-hook" }
+    ]
+  },
   {
     "scenarioDirName": "huggingface-instrumentation",
     "label": "HuggingFace Instrumentation",
@@ -121,5 +133,11 @@
         "label": "v0.2.81"
       }
     ]
+  },
+  {
+    "scenarioDirName": "cursor-sdk-instrumentation",
+    "label": "Cursor SDK Instrumentation",
+    "metadataScenario": "cursor-sdk-instrumentation",
+    "variants": [{ "variantKey": "cursor-sdk-v1", "label": "v1" }]
   }
 ]
diff --git a/e2e/helpers/scenario-installer.ts b/e2e/helpers/scenario-installer.ts
@@ -22,9 +22,11 @@ const INSTALL_SECRET_ENV_VARS = [
   "ANTHROPIC_API_KEY",
   "BRAINTRUST_API_KEY",
   "COHERE_API_KEY",
+  "CURSOR_API_KEY",
   "GEMINI_API_KEY",
   "GITHUB_TOKEN",
   "GH_TOKEN",
+  "GROQ_API_KEY",
   "HUGGINGFACE_API_KEY",
   "OPENAI_API_KEY",
   "OPENROUTER_API_KEY",
@@ -36,10 +38,9 @@ let cleanupRegistered = false;
 
 type CanaryDependencyRule = {
   packageName: string;
-  query: string;
+  version: string;
 };
 
-const canaryVersionCache = new Map<string, string>();
 const HELPERS_DIR = path.dirname(fileURLToPath(import.meta.url));
 const E2E_ROOT = path.resolve(HELPERS_DIR, "..");
 
@@ -154,32 +155,6 @@ function packageSpecifier(
     : `npm:${packageName}@${version}`;
 }
 
-async function resolveCanaryVersion(
-  rule: CanaryDependencyRule,
-): Promise<string> {
-  const cacheKey = rule.query;
-  const cached = canaryVersionCache.get(cacheKey);
-  if (cached) {
-    return cached;
-  }
-
-  const output = await spawnOrThrow(
-    PNPM_COMMAND,
-    ["view", rule.query, "version", "--json"],
-    process.cwd(),
-    installEnv(),
-  );
-  const parsed = JSON.parse(output) as string | string[];
-  const version = Array.isArray(parsed) ? parsed.at(-1) : parsed;
-
-  if (typeof version !== "string") {
-    throw new Error(`Could not resolve canary version for ${rule.query}`);
-  }
-
-  canaryVersionCache.set(cacheKey, version);
-  return version;
-}
-
 function parseCanaryDependencyRule(
   dependencyName: string,
   rawRule: string,
@@ -194,7 +169,7 @@ function parseCanaryDependencyRule(
   if (rawRule === "latest") {
     return {
       packageName: dependencyName,
-      query: dependencyName,
+      version: "latest",
     };
   }
 
@@ -207,7 +182,7 @@ function parseCanaryDependencyRule(
 
   return {
     packageName: rawRule.slice(0, versionSeparator),
-    query: rawRule,
+    version: rawRule.slice(versionSeparator + 1),
   };
 }
 
@@ -229,11 +204,10 @@ async function rewriteManifestForCanary(scenarioDir: string): Promise<void> {
       rawRule,
       scenarioDir,
     );
-    const version = await resolveCanaryVersion(rule);
     dependencies[dependencyName] = packageSpecifier(
       dependencyName,
       rule.packageName,
-      version,
+      rule.version,
     );
     updated = true;
   }

diff --git a/e2e/scenarios/ai-sdk-instrumentation/scenario.impl.mjs b/e2e/scenarios/ai-sdk-instrumentation/scenario.impl.mjs
@@ -143,7 +143,7 @@ async function runAISDKInstrumentationScenario(
 ) {
   const instrumentedAI = decorateAI ? decorateAI(options.ai) : options.ai;
   const openaiModel = options.openai("gpt-4o-mini-2024-07-18");
-  const anthropicModel = options.anthropic?.("claude-3-haiku-20240307");
+  const anthropicModel = options.anthropic?.("claude-haiku-4-5");
   const openaiEmbeddingModel = options.openai.textEmbeddingModel(
     "text-embedding-3-small",
   );

diff --git a/e2e/scenarios/anthropic-instrumentation/__snapshots__/anthropic-v0273.log-payloads.json b/e2e/scenarios/anthropic-instrumentation/__snapshots__/anthropic-v0273.log-payloads.json
@@ -29,26 +29,26 @@
       }
     ],
     "metadata": {
-      "model": "claude-3-haiku-20240307",
+      "model": "claude-haiku-4-5",
       "provider": "anthropic",
       "stop_reason": "end_turn",
       "stop_sequence": null
     },
     "metrics": {
-      "completion_tokens": 5,
+      "completion_tokens": 4,
       "end": 0,
       "prompt_cache_creation_tokens": 0,
       "prompt_cached_tokens": 0,
       "prompt_tokens": 12,
       "start": 0,
       "time_to_first_token": 0,
-      "tokens": 17
+      "tokens": 16
     },
     "name": "anthropic.messages.create",
     "output": {
       "content": [
         {
-          "text": "OK.",
+          "text": "OK",
           "type": "text"
         }
       ],
@@ -93,20 +93,20 @@
       }
     ],
     "metadata": {
-      "model": "claude-3-haiku-20240307",
+      "model": "claude-haiku-4-5",
       "provider": "anthropic",
       "stop_reason": "end_turn",
       "stop_sequence": null
     },
     "metrics": {
-      "completion_tokens": 29,
+      "completion_tokens": "<number>",
       "end": 0,
       "prompt_cache_creation_tokens": 0,
       "prompt_cached_tokens": 0,
       "prompt_tokens": 1389,
       "start": 0,
       "time_to_first_token": 0,
-      "tokens": 1418
+      "tokens": "<number>"
     },
     "name": "anthropic.messages.create",
     "output": {
@@ -139,23 +139,23 @@
       }
     ],
     "metadata": {
-      "model": "claude-3-haiku-20240307",
+      "model": "claude-haiku-4-5",
       "provider": "anthropic",
       "stop_reason": "end_turn",
       "stop_sequence": null
     },
     "metrics": {
-      "completion_tokens": 18,
+      "completion_tokens": 15,
       "end": 0,
       "prompt_cache_creation_tokens": 0,
       "prompt_cached_tokens": 0,
       "prompt_tokens": 24,
       "start": 0,
       "time_to_first_token": 0,
-      "tokens": 42
+      "tokens": 39
     },
     "name": "anthropic.messages.create",
-    "output": "1 - one\n2 - two\n3 - three",
+    "output": "1 one\n2 two\n3 three",
     "type": "llm"
   },
   {
@@ -177,23 +177,23 @@
       }
     ],
     "metadata": {
-      "model": "claude-3-haiku-20240307",
+      "model": "claude-haiku-4-5",
       "provider": "anthropic",
       "stop_reason": "end_turn",
       "stop_sequence": null
     },
     "metrics": {
-      "completion_tokens": 18,
+      "completion_tokens": 15,
       "end": 0,
       "prompt_cache_creation_tokens": 0,
       "prompt_cached_tokens": 0,
       "prompt_tokens": 24,
       "start": 0,
       "time_to_first_token": 0,
-      "tokens": 42
+      "tokens": 39
     },
     "name": "anthropic.messages.create",
-    "output": "1 - one\n2 - two\n3 - three",
+    "output": "1 one\n2 two\n3 three",
     "type": "llm"
   },
   {
@@ -215,7 +215,7 @@
       }
     ],
     "metadata": {
-      "model": "claude-3-haiku-20240307",
+      "model": "claude-haiku-4-5",
       "provider": "anthropic",
       "stop_reason": "tool_use",
       "stop_sequence": null
@@ -225,10 +225,10 @@
       "end": 0,
       "prompt_cache_creation_tokens": 0,
       "prompt_cached_tokens": 0,
-      "prompt_tokens": 454,
+      "prompt_tokens": 687,
       "start": 0,
       "time_to_first_token": 0,
-      "tokens": 480
+      "tokens": 713
     },
     "name": "anthropic.messages.create",
     "output": {
@@ -265,20 +265,20 @@
       }
     ],
     "metadata": {
-      "model": "claude-3-haiku-20240307",
+      "model": "claude-haiku-4-5",
       "provider": "anthropic",
       "stop_reason": "tool_use",
       "stop_sequence": null
     },
     "metrics": {
-      "completion_tokens": 55,
+      "completion_tokens": 56,
       "end": 0,
       "prompt_cache_creation_tokens": 0,
       "prompt_cached_tokens": 0,
-      "prompt_tokens": 357,
+      "prompt_tokens": 589,
       "start": 0,
       "time_to_first_token": 0,
-      "tokens": 412
+      "tokens": 645
     },
     "name": "anthropic.messages.create",
     "output": {