動画多言語化の「コスト」と「時間」を破壊する。
文字起こし・翻訳・吹き替え・BGMダッキング調整まで。
すべてを「寝ている間」に完結させる、ローカル完結型AIスタジオ。
Create Image with: “Cyberpunk UI interface of Auto-Dub Pro, displaying waveform ducking, multi-language subtitles, and sequential processing status”
FFmpegのサイドチェーン圧縮を自動適用。ナレーション発話中のみBGM音量を下げる「ダッキング」を実装。さらにGoogle Cloud TTS Neural2により、記号や数字の読み間違いを排除した自然な発話を実現。
単なる行単位の翻訳ではありません。Google Gemini 2.5/3.0 Proを使用し、前後の文脈(コンテキスト)を維持した翻訳を実行。専門用語辞書も適用可能で、意味の通る字幕を作成します。
OpenAI Whisper Large-v3-turboとAPIキーローテーションシステムを搭載。APIレート制限(429エラー)による中断を回避し、夜間にセットすれば朝には大量の動画処理が完了します。