Transcript Excerpt: 沉浸式翻译里 Gemini 3 的视频字幕调参

Date: 2026-04-12

Context(背景)

Buu 的重点不是抽象比较思考等级,而是要让 YouTube 视频字幕翻译在保持较高质量的同时,能跟得上播放速度。

User judgments recorded(已记录的用户判断)

  • 当前已经实测到:HIGH 基本可用。
  • 当前主要问题不是完全不可用,而是偶尔卡顿。
  • Buu 认为更关键的参数不是一堆字幕显示开关,而是这些吞吐与分包相关参数:
    • 每秒最大请求数
    • 每次请求最大文本长度
    • 每次请求最大段落数
    • 每次字幕请求最大段落数
  • Buu 当前判断:Gemini 3 系列模型不只是这个场景,而是在所有场景下,temperature1 都更合适。
  • 这条结论希望记录进 llm-wiki,避免下次忘记。

Durable takeaway(可长期复用结论)

  • 对 Buu 来说,沉浸式翻译 + Gemini 3 的核心优化目标不是静态翻译质量最大化,而是:
    • 在能跟上视频字幕速度的前提下,使用最高可行档位。
  • 当前 Buu 已接受 HIGH 作为可行起点。
  • 当前更值得优先调的,是吞吐、分包、分段相关参数,而不是外围显示型开关。
  • 当前用户偏好结论:Gemini 3 系列在这个场景里,temperature: 1 更合适。