完全自動化が生むゴミ動画から卒業し、プロ品質の動画を量産するための「半自動化」戦略を公開。
はじめに:なぜ「完全自動化」は失敗するのか
「動画制作をAIで全自動化したい」誰もが一度はそう夢見ます。しかし、実際に試した多くの人が直面するのは、「違和感だらけの成果物」と、その修正にかかる「莫大な手間」です。
本記事では、私が開発したAIエージェント用スキル「Video Production Master」の実演を通じ、なぜプロが「半自動化(Human-in-the-loop)」を選ぶのか、その理由と具体的なワークフローを解説します。
開発のゴール:品質と効率の共存
目指すのは、単なる手抜きではありません。
- AIの得意領域:文字起こし、翻訳、コード生成、単純作業のループ
- 人間の得意領域:違和感の検知、微細なデザイン調整、感情の機微
この2つを掛け合わせ、「人間が指揮官となり、AIが手足となる」最強の布陣を構築すること。それが本スキルのゴールです。
使用ツールと呪文
- Agent: Antigravity (Gemini 3 Pro / Claude 4.5 Sonnet)
- Skill: Video Production Master (Python Based)
- Recording: Bandicam
実演ワークフロー解説
STEP 1: 企画とスライド作成(モードA)
まずはアイデア出しです。エージェントに「こんな動画を作りたい」と相談し、企画書を作成させます。
# 実際のフォルダ操作
ドラッグ&ドロップで企画書をエージェントに渡し、
「モードA_動画企画スタート.md」を投げるだけ。これだけで、エージェントは自動的にHTMLベースのスライド(スライドデック)を作成します。ここで重要なのは、「人間による目視チェック」です。
現在の最高峰モデルであるGemini 3 Proであっても、スライドのデザインには必ず「余白がおかしい」「文字が大きすぎる」といった微細なズレが生じます。これを人間が指摘し、修正させる。この往復こそがクオリティを担保します。
STEP 2: 撮影(Human Work)
完成したスライドを使い、Bandicamで自分の声を吹き込みながら撮影します。ここは完全に人間だけのクリエイティブな時間です。
STEP 3: 制作・デリバリー(モードB)
撮影した動画ファイル(cut.mp4)をプロジェクトフォルダに入れ、「モードB」を発動させます。
python ".../run_pipeline.py" --step transcribeここからAIのターンです。
- 文字起こし: Whisper等のAPIを使い、一瞬で字幕データを生成。
- SEO生成: 動画の内容を理解し、YouTube用のタイトル・概要欄・タグを自動提案。
- サムネ案出し: 「クリックしたくなる」コピーと構図を考案。
私がやることは、出来上がった成果物を確認し、「GOサイン」を出すだけ。面倒な単純作業はすべてAIが肩代わりしてくれます。
OKIHIRO流:司令官の視点
「違和感」は人間にしかわからない
動画内で語った通り、現状のAIは「コード的には合っているが、デザイン的にダサい」という状態を認識できません。
「なんか文字が詰まってて見にくいな」という感覚は、数多くのデータを見てきた人間にしか備わっていないセンサーです。どんなにモデルが進化し、Claude 4.5 Opusのような超高知能モデルが出てきたとしても、最終的な「人間の感性」へのジャッジは、人間にしかできません。
だからこそ、最終決定権(Last Mile)は必ず人間が持つべきなのです。
まとめ&ネクストアクション
「Video Production Master」は、この「半自動化」の哲学を具現化したスキルセットです。
もしあなたがAIによる自動化で「品質の壁」にぶつかっているなら、一度「どこまでを人間に残すべきか」を見直してみてください。答えは意外と、足元の「半自動」にあるかもしれません。
この記事の自動化に使われた技術と思考法は、
すべて以下のアカデミーでインストールできます。


コメント