YouTubeナレーションの録り方|声の出し方・マイク設定・編集のコツ
YouTube動画のナレーション録音を成功させる方法。マイクの選び方、声の出し方、台本の読み方、編集テクニックまで解説。
YouTube動画のナレーションは「声がいい人だけの技術」ではありません。マイクの正しい設定、発声の基本、台本の組み立て方を押さえれば、誰でも聞き取りやすいナレーションを録れます。
視聴者の84%は映像よりも音質を重視するという調査があります([source][1])。画質が多少荒くても視聴は続きますが、音声が聞き取りにくいと数秒で離脱されます。つまりナレーションのクオリティは、再生回数よりも視聴維持率に効きます。
この記事では、マイク選びから声の出し方、台本の読み方、録音後の編集まで、実践的な手順を解説します。ゆっくり解説・VOICEVOXのような音声合成ナレーションではなく、自分の声で録音するケースが対象です。
YouTubeナレーションの3つのスタイル
ナレーションと一口に言っても、録音のタイミングと動画との組み合わせでスタイルが分かれます。
| スタイル | 特徴 | 向いているジャンル |
|---|---|---|
| フルナレーション | 動画全編を声で解説。映像はスライド・B-ロール・テキストアニメ | 教育系、解説系、ドキュメンタリー |
| 画面録画+ナレーション | PC/スマホ操作を見せながらリアルタイムまたは後から声を重ねる | チュートリアル、ソフトレビュー、ゲーム実況 |
| 部分ナレーション | 顔出し映像のつなぎや補足としてナレーションを挟む | Vlog、レビュー、ニュース解説 |
どのスタイルでも、録音環境・マイク・発声の基本は同じです。
録音環境の整え方
高価なマイクを買っても、部屋の反響やノイズが多ければ台無しになります。まず環境を整える方が、マイクをアップグレードするより効果が大きいです。
反響を減らす
部屋の壁・天井・床が硬い素材だと、声が跳ね返ってエコーがかかります。吸音の基本ルールはシンプルで、柔らかい素材を声の反射面に置くことです。
- クローゼットの中が最も手軽な簡易ブース。服が天然の吸音材として機能する
- 厚手の毛布をマイクの背後や壁に掛ける。効果は吸音パネルに近い
- 本棚は不規則な表面で音の拡散効果がある。空の壁よりはるかにいい
- 机の上のリフレクションフィルター(3,000-8,000円)はマイク背面の反響を直接ブロックする
反響の確認方法: 録音位置で手を叩き、パチンの後に「ビーン」という残響が聞こえたら対策が必要です。残響が聞こえなければ十分です。
環境ノイズの対処
完全無音の部屋は現実的ではありません。目標は「録音後にノイズ除去で処理できるレベル」に抑えることです。
| ノイズ源 | 対策 |
|---|---|
| エアコン | 録音中は停止。できない場合はダイナミックマイクを選ぶ |
| PC ファン | マイクをPC から離す。デスクトップはデスク下へ |
| 外の交通音 | 窓を閉めてカーテンを引く。深夜・早朝に録音する |
| キーボード音 | 画面録画時は静音キーボードか、ナレーションを後録りにする |
| 冷蔵庫 | 録音部屋と同じ空間にある場合はコンセントを一時的に抜く |
マイクの選び方と設定
コンデンサー vs ダイナミック
YouTubeナレーション用マイクは大きく2種類あります。
| コンデンサー | ダイナミック | |
|---|---|---|
| 感度 | 高い(繊細な声を拾う) | 低い(近い音だけ拾う) |
| 環境ノイズ | 拾いやすい | 拾いにくい |
| 向いている環境 | 静かな専用スペース | 生活音がある自宅 |
| 代表機種 | Audio-Technica AT2020(約10,000円) | SHURE SM58(約13,000円) |
| USB モデル | AT2020USB+(約16,000円) | SHURE MV7+(約30,000円) |
| 電源 | ファンタム電源 or USB | 不要 or USB |
初心者への推奨: USBコンデンサーマイク(AT2020USB+など)から始めるのが手軽です。オーディオインターフェースが不要で、PCに差すだけで使えます。部屋が静かでない場合はUSBダイナミック(SHURE MV7+やSamson Q2Uなど)を選びます。詳しい比較はマイクガイドをどうぞ。
ゲインとマイク距離
ゲイン(入力音量)の設定を間違えると、どんな高級マイクでも使い物になりません。
- マイクとの距離: 拳1-2個分(10-20cm)が基本。近すぎると低音が誇張され(近接効果)、離れすぎると部屋の反響を拾う
- ゲイン設定: 普通の声量で話して、録音ソフトのレベルメーターが -12dB から -6dB の間で振れるように調整する。0dBに近づくとクリッピング(音割れ)が起きる
- ポップフィルター: 「パ」「プ」「ブ」の破裂音を防ぐフィルター。マイクの前5-10cmに設置。500-1,500円で買える必需品
録音ソフトの選び方
| ソフト | 価格 | 最適な用途 | 特徴 |
|---|---|---|---|
| Audacity | 無料 | ナレーション専用録音 | 軽量、ノイズ除去内蔵、日本語UI対応 |
| OBS Studio | 無料 | 画面録画+ナレーション同時 | ゲーム実況・チュートリアルに最適 |
| CapCut | 無料 | 編集中のアフレコ | 動画タイムライン上でそのまま録音可能(使い方ガイド) |
| Adobe Audition | 月額2,728円 | プロ用マルチトラック録音 | Premiere連携、高度なノイズ処理 |
| GarageBand | 無料(Mac) | Mac ユーザーの録音 | 直感的UI、AUプラグイン対応 |
ほとんどの場合、Audacity + 動画編集ソフト の組み合わせで十分です。動画編集ソフトの選び方はこちらで詳しく比較しています。
声の出し方とスピード
マイクと環境が整ったら、次は声そのものです。「いい声」は生まれつきではなく、いくつかのテクニックで大幅に改善できます。
発声の基本
- 腹式呼吸: 胸ではなく腹で呼吸する。横隔膜を使うことで声が安定し、息切れが減る。仰向けに寝て呼吸するとき腹が動く感覚がそれ
- 口を大きく開ける: 日本語は口の動きが小さくなりがち。意識的に口を動かすことで滑舌が改善される
- 姿勢: 座って録音する場合は背筋を伸ばす。猫背だと横隔膜が圧迫されて声が細くなる
ウォームアップ(5分で完了)
録音前のウォームアップは声の安定感を大きく変えます。
| エクササイズ | 時間 | 効果 |
|---|---|---|
| リップロール | 1分 | 唇を振動させながら声を出す。声帯のストレッチ |
| ハミング | 1分 | 鼻腔共鳴を活性化。声の響きが増す |
| 滑舌練習 | 1分 | 「生麦生米生卵」などの早口言葉を3回 |
| 腹式呼吸 | 1分 | 4拍吸って、4拍止めて、8拍で吐く × 5回 |
| 冒頭リハーサル | 1分 | 台本の最初の段落をエネルギー+30%で3回読む |
特に冒頭リハーサルは重要です。録音開始直後の声が最もぎこちなくなるため、本番前に同じ文章を声に出しておくことでコールドスタートを避けられます。
話すスピードの目安
| ジャンル | 推奨速度 | 1分間の文字数 |
|---|---|---|
| 教育系・解説系 | ゆっくりめ | 300-350文字 |
| レビュー・紹介系 | 普通 | 350-400文字 |
| エンタメ・トーク系 | やや速め | 400-450文字 |
日本語の平均的な話速は約350文字/分です([source][2])。教育系は少し遅めの方が理解しやすく、エンタメ系は勢いがある方が視聴者を引きつけます。
コツ: 「ゆっくり話しすぎかも」と感じるくらいが、録音で聞き返すとちょうどいい速度になっていることが多いです。
抑揚をつける
棒読みが一番の敵です。一本調子のナレーションは数十秒で離脱を招きます。
- キーワードを強調: 各文の中で最も伝えたい単語を少し強く・少しゆっくり言う
- 文の終わりを下げる: 日本語ナレーションでは文末を下げ気味にすると落ち着いた印象になる。語尾を上げると質問調になり不安定に聞こえる
- 間(ま)を使う: 重要なポイントの前に0.5-1秒の間を入れる。視聴者の注意を引き直す効果がある
- 感情を少し乗せる: カメラと同じで、録音では感情が30%ほどフラットに聞こえる([source][3])。普段よりやや大げさに話す方が自然に聞こえる
台本の書き方と読み方
台本の3つのスタイル
| スタイル | 特徴 | リスク | 向いている人 |
|---|---|---|---|
| 全文台本 | 一語一句書いてその通りに読む | 棒読み・ロボット的になりやすい | 技術データが多い動画、正確さ重視 |
| 箇条書きメモ | キーポイントだけ書いてアドリブで話す | 言い淀み・脱線しやすい | トーク力のあるベテラン |
| ハイブリッド | 冒頭+データは全文、残りは箇条書き | バランスが取りやすい | ほとんどのクリエイターにおすすめ |
ハイブリッド方式の具体例:
【冒頭 — 全文】
YouTubeのナレーション録音で最も大事なのは声質ではなく、
聞き取りやすさです。
【セクション2 — 箇条書き】
・マイク距離 = 拳1-2個
・ゲイン = -12 to -6dB
・ポップフィルター必須
→ 「パ行」の破裂音を防ぐ
【重要データ — 全文】
視聴者の84%が音質を映像より重視しています。
読み方のコツ
- 一人の友人に話しかけるイメージ: 聴衆に向かってプレゼンするのではなく、友人に説明する感覚で読む。これだけで声のトーンが自然になる
- 句読点で確実に間を取る: 文章を目で追って早く読み進めたくなるが、句点(。)で0.5秒、段落切り替えで1秒の間を入れる
- マイクに向かって「話す」のであって「読む」のではない: 台本を暗記する必要はないが、文字を追うだけにならないよう意識する
動画の企画や構成テンプレートもあわせて参考にしてください。
録音のワークフロー
ステップ 1: テスト録音(2分)
本番前に必ずテスト録音をします。確認ポイントは3つです。
- レベルメーターが -12dB ~ -6dB に収まっているか
- 環境ノイズ: 無音部分を10秒録って再生。気になるノイズがないか
- 反響: 手を叩いて残響音がないか
ステップ 2: セクション単位で録音
動画全体を一気に録らず、セクション(見出し)ごとに区切って録音します。
- 1セクションは2-5分が目安
- 言い間違えたら3秒間を空けてから言い直す(編集時にカットしやすくなる)
- 各セクションの冒頭は少しエネルギーを上げて読む(セクション中盤で自然に落ち着く)
ステップ 3: ミスの扱い
完璧なテイクを目指さないでください。ミスしても録音を止めず、数秒空けてから同じ文を言い直します。
プロのナレーターも1回のセッションで何十回もリテイクします([source][4])。ミスを編集で切り取る前提で、リラックスして録音する方が全体の仕上がりが良くなります。
ナレーション編集の3ステップ
録音が終わったら、編集で仕上げます。動画編集の基本と合わせて確認してください。
ステップ 1: 無音カットとミス除去
- 言い間違い、言い直しの不要部分をカット
- 長すぎる無音(2秒以上)を0.5-1秒に短縮
- 呼吸音が目立つ場合は音量を下げる(完全に消すと不自然になる)
Audacityなら「無音の短縮」機能で一括処理できます。
ステップ 2: コンプレッサー(音量の均一化)
声の大きい部分と小さい部分の差を縮めます。これにより、視聴者が音量を上げ下げしなくて済みます。
Audacity の推奨設定:
- しきい値: -18dB
- レシオ: 3:1
- アタック: 10ms
- リリース: 100ms
ステップ 3: ノーマライズ(-14 LUFS)
YouTubeは-14 LUFSを推奨ラウドネスとしています([source][5])。ノーマライズをかけることで、他の動画と音量が揃い、視聴者が音量調整する必要がなくなります。
必ずこの順序で処理してください: 無音カット → コンプレッサー → ノーマライズ。順序を変えるとコンプレッサーが意図通りに動きません。
より高度なノイズ処理が必要な場合はノイズ除去ガイドをどうぞ。
よくある5つの失敗と対策
| 失敗 | 原因 | 対策 |
|---|---|---|
| ポップノイズ(「パ」「ブ」で爆音) | マイクに直接息が当たっている | ポップフィルター設置。マイクを口の正面からやや外す |
| リップノイズ(ぺちゃぺちゃ音) | 口が乾燥している | 録音前に水を飲む。青リンゴを噛むと唾液が出やすい |
| 部屋鳴り(エコー・反響) | 硬い壁面からの反射 | 毛布・クローゼット・リフレクションフィルターで吸音 |
| 音量のバラつき | マイクとの距離が変動 | マイクアームで固定。頭をあまり動かさない |
| 棒読み | 台本を読むことに集中しすぎ | ハイブリッド台本に切り替え。キーワード強調を意識 |
機材別の初期投資目安
段階的にアップグレードするのがおすすめです。詳しい機材選びは機材ガイドを参照してください。
| レベル | 機材 | 予算 |
|---|---|---|
| 最小構成 | USBマイク + ポップフィルター | 6,000-10,000円 |
| 標準構成 | USBマイク + ポップフィルター + マイクアーム + リフレクションフィルター | 15,000-25,000円 |
| 本格構成 | XLRマイク + オーディオインターフェース + マイクアーム + 吸音材 | 30,000-50,000円 |
最小構成でも、正しい設定と環境整備をすれば十分なクオリティが出せます。
Key Takeaways
- 音質は映像より重要。視聴者の84%が音質を重視。ナレーション品質は視聴維持率に直結する
- 環境整備が最優先。高価なマイクより、反響と環境ノイズの対策が先。クローゼットや毛布が効果的
- マイク設定: 距離は拳1-2個分、ゲインは-12dBから-6dB。ポップフィルターは必須
- 話すスピード: 教育系は300-350文字/分。普段よりゆっくり話す意識でちょうどよくなる
- 台本はハイブリッド方式。冒頭+データは全文、残りは箇条書き。棒読みと脱線の両方を防げる
- 編集は3ステップ: 無音カット → コンプレッサー → ノーマライズ(-14 LUFS)。順序が重要
- 最初の10本はぎこちなくて当たり前。ウォームアップ5分とリラックスした姿勢が上達の近道
Sources
- Viewers consider audio quality more important than video quality — Wistia — accessed 2026-04-06
- 日本語話速の研究 — 国立国語研究所 — accessed 2026-04-06
- YouTube On-Camera Confidence: The camera flattens emotion — ThumbMentor — accessed 2026-04-06
- Professional Voice Over Recording Tips — Voices.com — accessed 2026-04-06
- Loudness normalization — YouTube Help — accessed 2026-04-06
- Audio-Technica AT2020 Specifications — Audio-Technica — accessed 2026-04-06
- SHURE SM58 — SHURE — accessed 2026-04-06
- Audacity Manual — Compressor — accessed 2026-04-06
- OBS Studio Quick Start — OBS Project — accessed 2026-04-06
- Adobe Podcast — Enhance Speech (free tier) — accessed 2026-04-06
- 声の出し方と発声練習 — NHK放送研修センター — accessed 2026-04-06
- SHURE MV7+ USB/XLR Microphone — SHURE — accessed 2026-04-06
- How to Record Better Audio for YouTube — r/NewTubers — accessed 2026-04-06