CapCutを使用したことがない方は下記YouTube動画を参考に基本的な操作はできるようにしてください。https://drive.google.com/file/d/1y4ckC8jemsnvkRj9EV_3mp_0nUo6U535/view?usp=drive_link
動画編集の流れ
- AI音声素材取り込み&カット
- テロップ入れ
- 素材挿入(動画・画像など)
- BGM・SE挿入
制作に慣れるまで、最初はこの流れで制作した方が時短になります!
AI音声は動画の完成尺を決めるものなので、一番最初に編集してください。
またAI音声はショート動画でとても重要になる『動画のテンポ感』を決める部分なので、ここで間の詰め方などカット編集を完璧に作っておけば、後々の修正も少なくなります。
AI音声素材取り込み&カット
◆テンポの調整は慎重に

間を詰めすぎると詰まった印象で不自然になり、空けすぎると間延びしてしまう。
自然な会話のテンポを意識して、0.2〜0.5秒の間を残すのがおすすめ
◆無音区間のノイズ確認
音声の波形が上がっているところでカットすると『プツッ』というノイズが入るので、フェードアウト・フェードインを使って違和感をなくす→わかりやすく解説されているサイトリンクですhttps://dnjiro.hatenablog.com/entry/capcut2#%E9%9F%B3%E3%81%AE%E8%AA%BF%E7%AF%80%E9%9F%B3%E9%87%8F%E3%83%95%E3%82%A7%E3%83%BC%E3%83%89%E3%82%A4%E3%83%B3%E3%83%95%E3%82%A7%E3%83%BC%E3%83%89%E3%82%A2%E3%82%A6%E3%83%88

◆イントネーションの流れを壊さない
AI音声は前後の文脈で抑揚を付けている場合があるので、途中で切ると不自然な高低差になることがある。→文単位・意味の切れ目で編集するのが理想。
◆AI音声の種類ごとにクセを把握する
ナレーション系、会話系、感情表現系などAI音声のタイプによって、切り方のクセが違う。
例:ひろゆき風→早口気味で間が短い
ゆっくり女性→間が長め、語尾が伸びる
※視聴者目線でどのAI音声であっても、違和感なく伝わりやすいカットを意識してください。
必要であれば、台本の文を変更・修正していただいてOKです。
テロップ入れ
◆音声とテロップのタイミングを合わせる
- AI音声とテロップの表示タイミングがズレると視聴者に違和感が出る。
- 発話と同時、または0.1〜0.3秒早めに出すと自然。
- 特に強調ワードは音とピッタリ合わせる。
◆一度に表示する文字数を絞る
- 画面が文字だらけになると視聴者が読むのを諦める。
- 1テロップ10〜15文字以内→ 長い文章は分割して表示。
◆重要ワードを目立たせる
キーワードだけ色・サイズ・エフェクトを変えると効果的。
→例:「高額査定!」だけ黄色+ポップアップアニメーション。
◆文字サイズの統一感を保つ
フォントサイズがバラバラだと画面がガチャついて素人感が出る。
通常文:28〜36pt、強調文:40〜48pt
一定の基準を決めておくと仕上がりがキレイ。
◆フォントの選び方
視認性重視ならゴシック体系(例:源ノ角ゴシック、ヒラギノ角ゴ)
親しみ感を出したいなら丸ゴシック
→ 特にスマホ視聴が多いショート動画では細すぎる明朝体や手書き風は避けるのが無難。
◆背景とのコントラスト確保
- 文字が背景に溶け込むと読めない。
- シャドウ・縁取り・透過黒帯を活用して可読性アップ
- 明るい背景なら黒縁取り+白文字、暗い背景なら白縁取り+黄色文字など
◆テンポのいい表示・非表示
- テロップの表示/消しのタイミングもテンポに直結。
- 1.5〜3秒以内で入れ替え
→ ダラダラ表示せず、動画のテンポ感に合わせて切り替え。
◆縦型動画は左右の余白に注意
スマホ縦画面では上下は広く使えるが左右が狭い
→テロップが左右ギリギリだと見切れるので、左右20〜40pxは余白を確保。
※背景の人物の顔にテロップが被ってしまうなど、明らかにテロップが背景を邪魔する位置にならないように意識する
◆エフェクトの使いすぎ注意
- 全部に動きやエフェクトを付けるとゴチャついて視聴疲れの原因に。
- 強調したい部分だけ動かす or 色を変える
→ メリハリをつける。
素材挿入(動画・画像など)
BGM・SE挿入
- AI音声は若干こもり気味 or フラットな音質になりがちなので、BGMやSEの音量が強いと埋もれる。
- BGMはAI音声より−6〜−10dB程度下げるのが目安。