Skip to content
Draft
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
41 changes: 41 additions & 0 deletions automations/livekit-agent/2026-06-11.markdown
Original file line number Diff line number Diff line change
@@ -0,0 +1,41 @@
# LiveKit Agents 工程日报

## 覆盖时间

**2026-06-10 00:01 UTC — 2026-06-11 00:01 UTC**(与 cron 触发 `2026-06-11T00:01:53Z` 对齐)

数据来源:`git log`、`gh` API 查询 [livekit/agents](https://github.com/livekit/agents) `main` 合并 PR。

**本仓库([Seventhen/agents](https://github.com/Seventhen/agents) `main`)**:过去 24 小时内 **无新合并提交**;`HEAD` 仍为 `f9b68de7`(2026-05-27,[#5857](https://github.com/livekit/agents/pull/5857))。相对上游 **落后 86 个提交**(`git rev-list --count origin/main..upstream/main`)。

**上游追踪(livekit/agents `main`)**:同期 **7 个已合并 PR**;以下要点均来自上游提交/PR 证据。

---

## 要点变更

- **Simulation 运行时完善(2 PR)**:延续昨日 [#5688](https://github.com/livekit/agents/pull/5688) 的 simulation 基础设施,今日合入 [#6037](https://github.com/livekit/agents/pull/6037)(04:33 UTC)与 [#6036](https://github.com/livekit/agents/pull/6036)(23:47 UTC)。前者在 simulator 断开连接时自动 `shutdown(reason="simulation completed")`,避免 agent 占住 worker slot、session report 上传被 `lk simulate` 的 SIGKILL 截断;后者新增隐藏 `--simulation` 标志,关闭 worker load limit(`_is_available()` 始终接受、不报告 `WS_FULL`),并在 TEXT 模式 simulation 中跳过 STT/TTS/VAD 初始化。影响:simulation 端到端生命周期更完整,text benchmark 不再无谓加载语音管线。

- **CI 类型检查大幅加速**([#5982](https://github.com/livekit/agents/pull/5982),02:29 UTC):typing stubs 迁入 `typing` 依赖组,GitHub Actions 增加 mypy 缓存层;PR 自述 mypy 从 **2 分 42 秒降至 3 秒**(含缓存),整 job 从 3.5 分钟降至 30 秒。影响:CI 反馈循环显著改善;`scripts/check_types.py` 现可识别缺失 typing 依赖并给出安装建议。

- **Sarvam STT 语音时序指标**([#5995](https://github.com/livekit/agents/pull/5995),05:04 UTC):`START_OF_SPEECH`、`FINAL_TRANSCRIPT`、`END_OF_SPEECH` 事件现携带时序数据供 EOU metrics 使用;延迟 final transcript 发射直至 speech-end 时间戳已知,同时保持 `FINAL_TRANSCRIPT` 在 `END_OF_SPEECH` 之前的顺序约束。+400 行含 `test_speech_timing.py` 回归测试。影响:使用 Sarvam STT 的 agent 可获得更准确的端到端延迟度量。

- **ElevenLabs server VAD 轮次结束修复**([#5872](https://github.com/livekit/agents/pull/5872),12:55 UTC):将 ElevenLabs server-VAD committed transcripts 映射为 LiveKit `END_OF_SPEECH`;手动 commit 模式行为不变;修复 `server_vad` 选项省略时被误判为 server VAD 的 URL 构建问题。影响:使用 ElevenLabs server VAD 的 STT 流可正确结束语音轮次,避免 turn 悬挂。

- **AWS Nova Sonic 不稳定错误恢复**([#6042](https://github.com/livekit/agents/pull/6042),22:21 UTC,fixes [#6010](https://github.com/livekit/agents/issues/6010)):将 Nova Sonic "System instability detected" `ValidationException` 视为可恢复流错误,走现有 realtime session 重启路径而非 fatal non-recoverable error;新增 `test_realtime_validation_errors.py`。影响:Nova Sonic realtime agent 在 provider 短暂不稳定时可自动恢复,减少会话中断。

- **Inference TTS Inworld delivery_mode**([#6048](https://github.com/livekit/agents/pull/6048),20:50 UTC):在 `inference/tts.py` 暴露 `delivery_mode` 参数(inference 层已支持)。影响:通过 LiveKit Inference 使用 Inworld TTS 的 agent 可控制音频交付模式。

---

## Watchlist

1. **Simulation 连续两日大变更**:昨日 [#5688](https://github.com/livekit/agents/pull/5688) CLI 重构 + 今日 [#6036](https://github.com/livekit/agents/pull/6036) / [#6037](https://github.com/livekit/agents/pull/6037) 生命周期与 load limit 变更叠加;建议在预发环境完整跑通 `lk simulate` text/audio 两种模式,确认 session report 上传、worker slot 释放、以及 `--simulation` 标志与 `LIVEKIT_AGENT_NAME_OVERRIDE`([#6022](https://github.com/livekit/agents/pull/6022))的交互无回归。

2. **插件 STT 时序行为差异**:Sarvam([#5995](https://github.com/livekit/agents/pull/5995))与 ElevenLabs([#5872](https://github.com/livekit/agents/pull/5872))同日修复 speech boundary 逻辑,但实现路径不同;若生产混用多 STT provider 或依赖 EOU metrics 做 barge-in 调优,需分别验证 turn 结束时机与 metrics 一致性。

3. **Fork 漂移持续扩大**:本仓库 `main` 已 **15 天无合并**,上游同期新增 simulation 运行时完善与 CI 基础设施变更;落后提交数从昨日 79 增至 **86**(+7,与今日合入 PR 数一致)。若生产基于本 fork,需计划 bulk sync,优先 cherry-pick simulation 栈([#6036](https://github.com/livekit/agents/pull/6036)、[#6037](https://github.com/livekit/agents/pull/6037))与 Nova Sonic 恢复([#6042](https://github.com/livekit/agents/pull/6042))。

---

*生成时间:2026-06-11(自动化 cron)*