feat: ✨ Add resilient schema parsing by jorben · Pull Request #9 · tiylabs/code-review-agent-action

jorben · 2026-05-27T08:23:35Z

Summary

Add plain-text JSON fallback when AI SDK structured output is unsupported or fails with No object generated.
Split agent output handling into strict generation schemas and tolerant parse schemas to normalize common model drift.
Update AI SDK dependencies and expand tests for schema coercion and fallback failure paths.

Test Plan

node --test test/agents.test.js test/model-runtime.test.js
npm run check
npm test
npm run test:schema-support with API credentials

🤖 Generated with TiyCode

Separate generation schemas (strict, for AI SDK structured output) from parse schemas (tolerant, with coercion preprocessing) to handle common model output drift: - String values where numbers expected (confidence, line numbers) - Percentage confidence ("90%" → 0.9) - Severity aliases ("Warning" → "medium", "Major" → "high") - Side aliases ("right" → "RIGHT", "added" → "RIGHT") - Non-array fields coerced to arrays - Invalid objects filtered from object arrays Add fallback from structured output to plain text JSON generation when providers do not support structured output, with clear error reporting when both paths fail. Update AI SDK dependencies to latest versions.

github-actions · 2026-05-27T08:30:56Z

AI 代码审查汇总

PR: #9 (feat: ✨ Add resilient schema parsing)
指定语言: 简体中文

总体评价

共发现 26 条可执行问题，建议优先处理 CRITICAL/HIGH。

主要问题（按严重级别）

HIGH (1)
- src/agents.js:7 - 8个新增coerce函数无对应单元测试
MEDIUM (14)
- src/agents.js:97 - coercePositiveIntegerOrNull 边界条件缺少测试验证
- src/agents.js:57 - coerceBoolean 对无法识别的值静默返回 false，可能导致 planner done 被误判
- src/agents.js:77 - coerceSeverity 对未识别输入静默降级为 'medium'，缺少可观测性
- src/agents.js:108 - coerceConfidence 百分比/小数混合解析边界缺少测试
- src/agents.js:94 - coerceSide 对未识别输入默认为 'RIGHT'，可能导致行号定位偏差
- src/agents.js:136 - coerceObjectArray 静默丢弃未通过 safeParse 的对象，发现项可能无声丢失
- src/agents.js:324 - generation/parse schema 双层架构缺少集成测试
- src/model-runtime.js:182 - shouldFallbackToTextJson启发式匹配缺乏测试且脆弱
LOW (11)
- src/agents.js:170 - coerceObjectArray preprocess 与 z.array 导致双重 Zod 校验
- src/agents.js:195 - coerce函数确保始终返回合法值，使findingSchema中z.enum约束变为不可达的死代码
- src/agents.js:103 - coercePositiveIntegerOrNull的前缀剥离逻辑边界条件未测试
- src/agents.js:133 - coerceObjectArray 使用 safeParse 静默丢弃无法解析的条目，可能掩盖schema问题
- src/agents.js:57 - coerceBoolean 对无法识别的输入默认返回false，对done字段是安全的但对其他布尔字段可能处理不当
- src/model-runtime.js:136 - parseStructuredObject 对 AI SDK 已解析输出执行冗余 safeParse
- test/agents.test.js:279 - side 边界测试缺少 undefined 和 null 输入
- test/agents.test.js:173 - planner done 边界测试仅覆盖 falsy 和字符串 'true'，遗漏布尔 true 及数值 1

可执行建议

在 coerceBoolean 的 JSDoc 或类型签名中明确返回值为 boolean | undefined，并审查所有调用方是否正确处理 undefined
评估 side 空字符串默认值从 RIGHT 改为 FILE 的可行性和影响
统一数值型和字符串百分比的 confidence 解读策略，或在文档中明确差异
在 allowRepair 选项文档中注明其不影响文本回退降级路径
为 agents.test.js 中 coerceSeverity/coerceSide 补充 null/undefined/数值输入边界测试
补充 planner done 和 side 的 truthy/undefined/null 边界用例使与 coerceBoolean/coerceSide 单元测试对称
添加 model-runtime repair 默认 allowRepair=true 与 text fallback 交互的集成测试
添加 text fallback JSON 合法但 parseSchema 验证失败的场景测试
为shouldFallbackToTextJson增加基于error.code/type的结构化匹配优先级，并将字符串匹配降级为后备
在coerceObjectArray中至少记录丢弃条目的数量以便调试
确保test/agents.test.js和test/model-runtime.test.js覆盖所有新增的coerce函数和回退路径
在coerce函数注释中标注设计决策（如为什么coerceBoolean默认返回false、coerceSeverity默认返回medium等）

潜在风险

coerceBoolean 返回 undefined 导致下游 if(bool) 逻辑将 undefined 视为 falsy 可能掩盖实际意图
数值型 confidence 50 被夹紧为 1 而非解读为 0.5，可能导致所有高置信度发现无区分度
模型返回 severity/side 为 null 或数值时，未测试路径可能产生未捕获异常
不支持 structured output 的模型在 repair 开启时可能触发多余的 API 调用，增加成本和延迟
text fallback JSON 合法但类型不匹配 parseSchema 时错误信息可能不够诊断性
SDK版本升级导致shouldFallbackToTextJson匹配失效，回退机制静默退化
coerceObjectArray大量丢弃条目时产出不完整结果影响下游决策
coerce函数的错误默认值（severity→medium, side→RIGHT, boolean→false）在特定场景下可能掩盖LLM输出的严重偏差
对不支持结构化输出的 provider，批量审查场景下双倍 API 延迟可能显著拖慢整体流水线
若未来 finding 数量大幅增长，双重 Zod 校验的 CPU 开销可能变为可感知的瓶颈
coerce函数无测试覆盖率导致重构时引入静默bug
provider SDK错误消息变化使shouldFallbackToTextJson回退失效

测试建议

添加集成测试验证 coerceBoolean(undefined) 返回值在 planner done 字段赋值后的完整行为
添加测试：文本 JSON 回退路径配合 parseSchema 归一化的端到端场景
添加测试：allowRepair:true 时文本回退失败后再走修复重试的路径
coerceSeverity(null) 应返回 'medium'（默认），coerceSide(undefined) 应返回 'RIGHT'（默认）
done=true (boolean)、done=1 (number) 的表达式测试
allowRepair=true + structured unsupported + invalid text JSON 的调用次数和错误码测试
text fallback 返回 {overall: 123} 且 parseSchema 要求 string 类型的 overall 时验证结果
为每个coerce函数编写边界值测试（空值、极端值、类型错误输入）
测试requestStructuredOutput的完整回退链路：结构化成功→直接返回，结构化失败→文本回退成功，双重失败→合并错误
测试plannerOutputSchema和reviewOutputSchema对畸形输入的容错能力（缺少字段、类型错误、嵌套结构异常）
为新增的coerceString/coerceStringArray/coerceBoolean/coerceSeverity/coerceSide/coercePositiveIntegerOrNull/coerceConfidence/coerceObjectArray编写边界条件测试
为shouldFallbackToTextJson编写单元测试覆盖各类错误消息匹配场景

文件级覆盖说明

test/agents.test.js: ok_with_concerns (新增的直接 coerce 函数测试和字段漂移归一化测试覆盖面显著提升，核心归一化逻辑的测试质量较高，主要缺口在边界对称性和极端类型输入。)
test/model-runtime.test.js: ok_with_concerns (新增的结构化输出不支持时降级到 text JSON 的测试是关键补充，但缺少与 repair 重试和 parseSchema 二次验证的组合场景。)
src/agents.js: needs_attention (变更量大（+226 行核心逻辑），新增函数均为 AI 输出后处理的关键路径，测试缺失风险高。)
src/model-runtime.js: medium_risk (回退机制和双路径解析是关键容错路径，需要测试保障以避免provider SDK升级导致的静默回归)

无法 inline 的已处理项

src/model-runtime.js: 结构化输出失败时 fallback 发起额外 API 调用可能使延迟翻倍 (max_inline_comments_cap_reached)
test/agents.test.js: coerceSeverity 和 coerceSide 缺少 null/undefined/数值输入的测试 (max_inline_comments_cap_reached)
test/agents.test.js: coerceBoolean 对 null/undefined 返回 undefined 而非 false，可能导致下游 TypeError (max_inline_comments_cap_reached)
test/model-runtime.test.js: text JSON fallback 成功解析后未测试 parseSchema 验证失败场景 (max_inline_comments_cap_reached)
test/model-runtime.test.js: runStructuredWithRepair 缺少 allowRepair=true 且 text fallback 也失败的场景测试 (max_inline_comments_cap_reached)
src/agents.js: coerceObjectArray preprocess 与 z.array 导致双重 Zod 校验 (max_inline_comments_cap_reached)
src/agents.js: coerce函数确保始终返回合法值，使findingSchema中z.enum约束变为不可达的死代码 (max_inline_comments_cap_reached)
src/agents.js: coercePositiveIntegerOrNull的前缀剥离逻辑边界条件未测试 (max_inline_comments_cap_reached)
src/agents.js: coerceObjectArray 使用 safeParse 静默丢弃无法解析的条目，可能掩盖schema问题 (max_inline_comments_cap_reached)
src/agents.js: coerceBoolean 对无法识别的输入默认返回false，对done字段是安全的但对其他布尔字段可能处理不当 (max_inline_comments_cap_reached)
src/model-runtime.js: parseStructuredObject 对 AI SDK 已解析输出执行冗余 safeParse (max_inline_comments_cap_reached)
test/agents.test.js: side 边界测试缺少 undefined 和 null 输入 (max_inline_comments_cap_reached)
test/agents.test.js: planner done 边界测试仅覆盖 falsy 和字符串 'true'，遗漏布尔 true 及数值 1 (max_inline_comments_cap_reached)
test/agents.test.js: 空字符串 side 值默认映射为 RIGHT，可能导致内联评论定位偏差 (max_inline_comments_cap_reached)
test/agents.test.js: 数值型 confidence > 1 被夹紧为 1 而非按百分比解读，可能丢失模型意图 (max_inline_comments_cap_reached)
test/agents.test.js: 证据字段 evidence 为对象或嵌套数组等非预期类型时无测试 (max_inline_comments_cap_reached)

覆盖状态

Target files: 4
Covered files: 4
Uncovered files: 0
No-patch/binary covered as file-level: 0
置信度未知（N/A）的问题数: 0

未覆盖文件清单:

无

无 patch 文件覆盖清单:

无

轮次与预算

轮次: 2/2
计划批次: 5
执行批次: 5
SubAgent 执行次数: 15
Planner 调用: 2
SubAgent 调用: 24
模型调用: 26/64
结构化输出降级为仅汇总评论: 否

github-actions

自动化 PR 审查已完成。

Findings kept: 17
Findings with unknown confidence: 0
Inline comments attempted: 10
Target files: 4
Covered files: 4
Uncovered files: 0
详细结论请查看汇总评论。

Sign in to view

+  if (['false', '0', 'no', 'n', 'pending'].includes(text)) {
+    return false;
+  }
+  return false;


Sign in to view

  return parsed.data;
 }

+function shouldFallbackToTextJson(error) {


Sign in to view

+    if (!item || typeof item !== 'object' || Array.isArray(item)) {
+      continue;
+    }
+    const parsed = itemSchema.safeParse(item);


Sign in to view

+    return null;
+  }
+
+  const normalized = text.includes('%') || numberValue > 1 ? numberValue / 100 : numberValue;


Sign in to view

+  if (['NONE', 'GENERAL', 'OVERALL'].includes(text)) {
+    return 'FILE';
+  }
+  return 'RIGHT';


Sign in to view

+  if (text.startsWith('crit') || text === 'blocker' || text === 'blocking') {
+    return 'critical';
+  }
+  if (text.startsWith('hi') || text === 'major') {


Sign in to view

+  });
+  assert.equal(parsedPercent.findings[0].confidence, 0.9);
+
+  const parsedOutOfRange = schema.parse({


Sign in to view

    /Expected number, received string/
  );

-  assert.throws(


Sign in to view

+
+  runtime.configureRuntime({ model: createFakeModel() });
+  const agent = createAgent();
+  const result = await runtime.runStructuredWithRepair(agent, 'review', { allowRepair: false });


Sign in to view

+  }
+
+  const text = String(value).trim();
+  const normalized = text.replace(/^[LR#:\s]+/i, '');


- Change "hi" severity match from startsWith to exact match to prevent "hint" from being incorrectly classified as "high" severity - Add "hint" as a valid alias for "low" severity - Remove numberValue > 1 condition from confidence normalization so only percentage values (with % sign) are divided by 100 - Add comprehensive test coverage for confidence bounds and hint severity

github-actions

自动化 PR 审查已完成。

Findings kept: 20
Findings with unknown confidence: 0
Inline comments attempted: 10
Target files: 4
Covered files: 4
Uncovered files: 0
详细结论请查看汇总评论。

Sign in to view

+const SEVERITIES = ['critical', 'high', 'medium', 'low'];
+const SIDES = ['LEFT', 'RIGHT', 'FILE'];
+
+function coerceString(value) {


Sign in to view

    model,
    instructions,
-    schema: plannerOutputSchema,
+    schema: plannerGenerationSchema,


Sign in to view

+  return Math.min(1, Math.max(0, normalized));
+}
+
+function coerceObjectArray(value, itemSchema) {


Sign in to view

+  if (['false', '0', 'no', 'n', 'pending'].includes(text)) {
+    return false;
+  }
+  return false;


Sign in to view

  return parsed.data;
 }

+function shouldFallbackToTextJson(error) {


Sign in to view

  }

-  const parsed = agent.schema.safeParse(parsedObject);
+  const schema = agent.parseSchema || agent.schema;


Sign in to view

  const userPrompt = buildUserInput(agent, input, repairContext);
  const model = agent.modelInstance || runtimeState.model;

+  try {


Sign in to view

+        category: null,
+        path: 'src/a.js',
+        side: 'right',
+        line: 'R42',


Sign in to view

+        severity: 'Warning',
+        category: null,
+        path: 'src/a.js',
+        side: 'right',


Sign in to view

+        reason: 'keep one path'
+      }
+    ],
+    done: 'true',


github-actions

自动化 PR 审查已完成。

Findings kept: 26
Findings with unknown confidence: 0
Inline comments attempted: 10
Target files: 4
Covered files: 4
Uncovered files: 0
详细结论请查看汇总评论。

github-actions · 2026-05-27T10:24:07Z

+const SEVERITIES = ['critical', 'high', 'medium', 'low'];
+const SIDES = ['LEFT', 'RIGHT', 'FILE'];
+
+function coerceString(value) {


[HIGH] 8个新增coerce函数无对应单元测试

src/agents.js新增的8个coerce函数承担了模型输出的核心容错解析逻辑，但目前没有任何单元测试覆盖其边界条件（如null/undefined输入、极端字符串、百分比置信度、带前缀行号等），回归风险高。

建议: 在test/agents.test.js中为每个coerce函数添加边界值测试：null/undefined/空字符串、超出范围的数值、各种别名映射（如'blocker'->critical）、百分比和0-1置信度、带L/R前缀行号等。

风险: 任何coerce逻辑的静默变更都可能导致模型输出被错误解析，直接影响review质量且难以察觉

置信度: 0.92

[来自 SubAgent：testing]

github-actions · 2026-05-27T10:24:07Z

+  return 'RIGHT';
+}
+
+function coercePositiveIntegerOrNull(value) {


[MEDIUM] coercePositiveIntegerOrNull 边界条件缺少测试验证

coercePositiveIntegerOrNull 的多条边界路径（0、负数、前缀剥离后空串、非数字字符串）行为需要显式测试用例确认。

建议: 添加测试：输入 0→null, -5→null, 'L0'→null, '#abc'→null, 'R3'→3, ' 42 '→42, ''→null, true→null 等。

风险: 边界条件错误可能导致 line 被设为 null（丢失定位）或错误值，影响 inline comment 发布。

置信度: 0.88

[来自 SubAgent：testing]

github-actions · 2026-05-27T10:24:07Z

+  if (['false', '0', 'no', 'n', 'pending'].includes(text)) {
+    return false;
+  }
+  return false;


[MEDIUM] coerceBoolean 对无法识别的值静默返回 false，可能导致 planner done 被误判

coerceBoolean 在无法匹配时硬编码返回 false，对于 planner 的 done 字段，任何非预期值都会阻止规划器标记为完成

建议: 考虑对无法识别的值返回默认值参数（如 coerceBoolean(value, defaultValue)），或在 done 字段上使用更宽松的匹配列表（如加入 'finished'/'complete'/'done'）

风险: 规划器可能永远无法标记 done=true，导致多余轮次或超时

置信度: 0.85

[来自 SubAgent：general]

github-actions · 2026-05-27T10:24:07Z

+  if (text.startsWith('lo') || text === 'minor' || text === 'info' || text === 'informational' || text === 'hint') {
+    return 'low';
+  }
+  return 'medium';


[MEDIUM] coerceSeverity 对未识别输入静默降级为 'medium'，缺少可观测性

未识别的 severity 值被静默降级为 'medium'，无日志或指标，导致输入质量问题不可追踪。

建议: 在 coerceSeverity 无法识别输入时，添加 console.warn 或 debug 日志记录原始值，或在返回对象中附加警告标记，使运营可观测。

风险: 模型输出中的 severity 拼写错误或新变体会被静默降级，掩盖数据质量问题。

置信度: 0.85

[来自 SubAgent：testing]

github-actions · 2026-05-27T10:24:07Z

+  return Number.isInteger(numberValue) && numberValue > 0 ? numberValue : null;
+}
+
+function coerceConfidence(value) {


[MEDIUM] coerceConfidence 百分比/小数混合解析边界缺少测试

coerceConfidence 涉及百分比/小数双模式、夹紧逻辑和 NaN 处理，边界条件复杂但缺少测试。

建议: 添加测试：'85%'→0.85, '0.85'→0.85, '150%'→1, '1.5'→1, '0'→0, '100%'→1, NaN→null, '-50%'→0, Infinity→null。

风险: confidence 解析错误可能导致 finding 被错误过滤或排序，影响评审优先级。

置信度: 0.85

[来自 SubAgent：testing]

github-actions · 2026-05-27T10:24:07Z

+  if (['NONE', 'GENERAL', 'OVERALL'].includes(text)) {
+    return 'FILE';
+  }
+  return 'RIGHT';


[MEDIUM] coerceSide 对未识别输入默认为 'RIGHT'，可能导致行号定位偏差

coerceSide 默认返回 'RIGHT' 可能导致原本属于 LEFT（旧代码）的行号被错误标记为新代码侧，影响评审定位。

建议: 对无法识别的 side 值记录警告，或在 coerceSide 返回时标记是否为 fallback 值，便于下游（如 diff-map.js）做额外校验。

风险: 行号定位偏差会导致 inline comment 发布到错误的 diff 侧，GitHub API 可能直接拒绝或误导开发者。

置信度: 0.82

[来自 SubAgent：testing]

github-actions · 2026-05-27T10:24:07Z

+    const parsed = itemSchema.safeParse(item);
+    if (parsed.success) {
+      out.push(parsed.data);
+    }


[MEDIUM] coerceObjectArray 静默丢弃未通过 safeParse 的对象，发现项可能无声丢失

coerceObjectArray 在 safeParse 失败时静默跳过，可能导致 LLM 生成的发现项被无声丢弃，用户无法得知审查结果不完整

建议: 添加计数或日志记录被丢弃的项数，至少在 debug 级别输出；或返回附带错误信息的结果以便上层处理

风险: 重要安全发现可能因字段缺失被静默丢弃，审查结果不完整且无感知

置信度: 0.82

[来自 SubAgent：general]

github-actions · 2026-05-27T10:24:07Z

    model,
    instructions,
-    schema: plannerOutputSchema,
+    schema: plannerGenerationSchema,


[MEDIUM] generation/parse schema 双层架构缺少集成测试

generation 和 parse schema 的协作逻辑未被测试覆盖，特别是 coerceObjectArray 在 parseSchema 中对未能通过 itemSchema.safeParse 的项被静默丢弃（R133-R136）。

建议: 添加集成测试：构造一个包含部分无效项的模型输出，验证 parseSchema 正确保留有效项、丢弃无效项，且最终结果符合 reviewOutputSchema。

风险: 如果 safeParse 过于严格丢弃了有价值但格式微偏差的 finding，会导致评审结果静默丢失。

置信度: 0.80

[来自 SubAgent：testing]

github-actions · 2026-05-27T10:24:07Z

  return parsed.data;
 }

+function shouldFallbackToTextJson(error) {


[MEDIUM] shouldFallbackToTextJson启发式匹配缺乏测试且脆弱

shouldFallbackToTextJson依赖消息字符串的启发式匹配来决定是否回退到文本JSON模式，但没有测试验证匹配逻辑，且匹配条件脆弱——provider SDK更新可能改变错误消息措辞。

建议: 为shouldFallbackToTextJson添加测试覆盖各种已知和未知的错误消息模式，并考虑添加更稳健的匹配策略（如错误类型/代码检查优先于消息匹配）。

风险: 回退逻辑失效会导致原本可恢复的structured output失败变成硬失败，降低系统可用性

置信度: 0.88

[来自 SubAgent：testing]

github-actions · 2026-05-27T10:24:07Z

+  return parseStructuredText(agent, result.text || '');
+}
+
+function parseStructuredObject(agent, outputObject) {


[MEDIUM] parseStructuredObject和parseStructuredText双路径解析缺少集成测试

新的双路径解析中，parseStructuredObject和parseStructuredText都会优先使用agent.parseSchema进行二次解析（容错coerce），但缺少测试验证当generation schema解析成功而parse schema产生不同结果时的行为。

建议: 添加测试：构造一个generation schema接受但parse schema会进一步coerce的对象，验证最终输出符合parse schema的约束。

风险: 如果parseSchema的coerce逻辑与generation schema行为不一致，可能产生静默的数据变形

置信度: 0.85

[来自 SubAgent：testing]

github-actions Bot reviewed May 27, 2026

View reviewed changes

test(agents): ✅ add boundary and unit tests for schema coerce functions

6380ee2

github-actions Bot reviewed May 27, 2026

View reviewed changes

jorben merged commit f24c42a into master May 27, 2026
2 checks passed

jorben deleted the feat/schema-coercion branch May 27, 2026 10:51

Conversation

jorben commented May 27, 2026

Summary

Test Plan

Uh oh!

github-actions Bot commented May 27, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

AI 代码审查汇总

总体评价

主要问题（按严重级别）

可执行建议

潜在风险

测试建议

文件级覆盖说明

无法 inline 的已处理项

覆盖状态

轮次与预算

Uh oh!

github-actions Bot left a comment

Choose a reason for hiding this comment

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

github-actions Bot left a comment

Choose a reason for hiding this comment

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

This comment was marked as outdated.

Uh oh!

github-actions Bot left a comment

Choose a reason for hiding this comment

Uh oh!

github-actions Bot May 27, 2026

Choose a reason for hiding this comment

Uh oh!

github-actions Bot May 27, 2026

Choose a reason for hiding this comment

Uh oh!

github-actions Bot May 27, 2026

Choose a reason for hiding this comment

Uh oh!

github-actions Bot May 27, 2026

Choose a reason for hiding this comment

Uh oh!

github-actions Bot May 27, 2026

github-actions Bot commented May 27, 2026 •

edited

Loading