MP3とは?音声圧縮、ビットレート、音質、MP3変換ツールを解説
MP3はWebで最もよく知られている圧縮音声形式のひとつです。ファイルサイズが小さく、共有しやすく、ほとんどの環境で再生できるため、スタジオ品質より互換性を優先したい場面で今でも役立ちます。
今すぐMP3を変換しますか?
メインのAudio Converterを使うと、複数のMP3ファイルをまとめて変換し、ビットレート、サンプルレート、mono/stereo出力を調整できます。処理はブラウザー内で行われ、ファイルはお使いの端末に残ります。
Audio Converterを開く目次
MP3ファイルとは?
MP3は MPEG-1 Audio Layer III の略です。音楽や音声ファイルを raw PCM音声より大幅に小さくしながら、日常的なリスニングに十分な聞きやすさを保つために作られた 圧縮デジタル音声形式です。MP3ファイルは通常 .mp3拡張子を持ち、Webでは audio/mpeg として配信されることが多いです。
MP3は lossy 形式です。つまり、encoderは元の音声から一部の情報を意図的に削除します。 ZIPやFLACのようなlossless圧縮とは違い、MP3をdecodeしても元の波形を完全には復元できません。 MP3の価値は、小さいファイルサイズ、速い転送、ほぼどこでも再生できる互換性のバランスにあります。
このバランスにより、MP3は長い間デジタル音楽の共通語になりました。適切に設定されたMP3は小さく、 streamしやすく、ダウンロードも速く、ブラウザー、スマートフォン、車載オーディオ、スマートスピーカー、 動画編集ソフト、古いメディアプレーヤーでも再生しやすい形式です。
MP3の簡単な歴史
MP3は初期のインターネット時代に有名になりましたが、その背景には知覚音声符号化の長い研究があります。 研究者たちは、非圧縮CD音声よりはるかに少ないデータ量で高品質な音楽を保存・送信する方法を探していました。
この形式はMPEG Audioの一部として標準化され、実用上の問題を解決したことで急速に広まりました。 1曲分の音声を、遅いインターネット回線や小さなハードディスクでも扱えるサイズにできたからです。
| 時期 | 主な出来事 |
|---|---|
| 1980年代 | Fraunhofer IISや協力機関の研究者が、MPEG Audioにつながる知覚音声符号化技術を開発しました。 |
| 1992-1993年 | MPEG-1 AudioがISO/IEC 11172-3として標準化され、Layer I、Layer II、Layer IIIが含まれました。 |
| 1995年 | .mp3という拡張子が選ばれ、一般ユーザーにも覚えやすい形式になりました。 |
| 1990年代後半 | 携帯音楽プレーヤー、ファイル共有、CDリッピング、初期のWebダウンロードにより、MP3はデジタル音楽の象徴になりました。 |
| 2000年代 | MP3はOS、携帯電話、ブラウザー、編集ソフト、音楽ライブラリで標準的な書き出し・再生形式になりました。 |
| 現在 | 新しいcodecの方が効率的な場合もありますが、MP3は互換性を重視する実用的な形式として残っています。 |
MP3はユーザーの期待も変えました。音声はディスクやテープ、大きなファイルに縛られるものではなくなり、 検索でき、ダウンロードでき、持ち運べて、端末間で簡単に移せるものになりました。
MP3圧縮の仕組み
MP3圧縮は psychoacoustics、つまり人間が音をどう知覚するかに基づいています。 encoderは単にbyteを小さくするのではなく、音声を分析し、聞こえにくい情報を予測して、 重要な部分にbitを多く割り当てます。
MP3 encodingを単純化すると、次のような流れです。
- 音声を小さなframeに分割する
- 時間方向のsampleを周波数情報へ変換する
- psychoacoustic modelでmaskingや聴覚閾値を推定する
- 聞こえにくい情報をより強くquantizeする
- 残った情報をMPEG audio bitstreamとして格納する
重要なのはmaskingです。大きな音は、時間や周波数が近い小さな音を隠すことがあります。 例えば強いsnareの音は、その周辺の細かな成分を聞こえにくくします。MP3はこの性質を利用して、 気づきにくい情報に使うbitを減らします。
そのためMP3は、元音源に近く聞こえながらファイルサイズを大きく減らせます。ただし、lossy音声を 再encodeするたびに情報がさらに失われるため、作業用masterとしては向いていません。
MP3ファイルの中身
MP3はMP4、MOV、WebMのようなcontainerとは少し違います。一般的なMP3はMPEG audio frameの連続で、 その前後にmetadata tagが付くことがあります。
+------------------------------+
| Optional ID3v2 tag | 曲名、アーティスト、アルバム、カバー画像
+------------------------------+
| MPEG audio frame |
| MPEG audio frame | encodeされた音声データ
| MPEG audio frame |
| ... |
+------------------------------+
| Optional ID3v1 tag | 末尾にある古いmetadata block
+------------------------------+各frameには小さなheaderと圧縮音声データが含まれます。headerにはMPEG version、layer、 bitrate、sample rate、channel mode、paddingの有無など、decodeに必要な情報が入っています。
frame構造のおかげで、MP3はファイル全体のダウンロードが終わる前に再生を始めやすい形式です。 これは初期のWeb音声で特に便利で、今でもpodcast、preview、ダウンロード用音声に向いています。
MP3のビットレートと音質
ビットレートは、1秒あたりに使えるbit数です。高いビットレートは一般に音質が良く、ファイルサイズも大きくなります。 低いビットレートは容量を節約できますが、シンバルの揺れ、transientの鈍さ、stereoの不安定さ、 声のにじみなどのartifactが出やすくなります。
| ビットレート | 向いている用途 | トレードオフ |
|---|---|---|
| 64-96 kbps | 音声メモ、文字起こし用音声、低帯域のプレビュー | 非常に小さいが、音楽では劣化が目立ちやすい |
| 128 kbps | 古い音楽ライブラリ、手早い共有 | 普段使いには許容できるが、artifactが聞こえやすい |
| 160-192 kbps | 一般的なリスニング、podcast、Webダウンロード | サイズと音質のバランスがよい |
| 224-256 kbps | 劣化を抑えた音楽共有 | ファイルは大きくなるが、transientやstereo感が改善しやすい |
| 320 kbps | 一般的なMP3の最高クラスの固定ビットレート書き出し | MP3としては大きいが、それでもlossy |
ファイルサイズは次の式でおおよそ計算できます。
ファイルサイズ(MB) = (bitrate(kbps) * 長さ(秒)) / 8 / 1024
例: 192 kbps * 180秒 / 8 / 1024 = 約4.2 MB音質を決めるのはビットレートだけではありません。encoderも重要です。新しいencoderは、 同じビットレートでも古いencoderや設定の悪いencoderより良い結果を出せることがあります。
CBRとVBR
MP3には constant bitrate と variable bitrate があります。 どちらも一般的ですが、向いている目的が違います。
CBR: 固定ビットレート
CBRはファイル全体で同じビットレートを使います。streaming、broadcasting、単純なサイズ見積もりには便利ですが、 簡単な部分にbitを使いすぎ、複雑な部分で足りなくなることがあります。
VBR: 可変ビットレート
VBRは複雑な部分に多く、単純な部分に少ないbitを使います。同じ平均サイズなら音質が良くなりやすい一方、 最終的なファイルサイズは正確に予測しにくくなります。
サンプルレート、チャンネル、ファイルサイズ
サンプルレートは、encode前に1秒あたり何個の音声sampleを扱うかを表します。MP3では CD audioで使われる 44.1 kHz や、動画制作でよく使われる48 kHz が一般的です。
多くの音楽では、元音源のサンプルレートを保つのが自然です。44.1 kHzから48 kHzへ、 またはその逆へresampleしても、それだけで音質が良くなるわけではありません。 音声のみなら低いsample rateやmonoでサイズを減らせますが、設定を下げすぎると聞き疲れしやすくなります。
- Mono は音声メモ、講義、インタビュー、電話風の録音に向いています。
- Stereo は音楽、環境音、左右の定位が重要な音に向いています。
- Joint stereo はstereo情報を効率よく保存でき、MP3 encoderでよく使われます。
MP3でよくある音の劣化
Artifactとは、encodingによって生じる望ましくない音です。低ビットレート、変換の繰り返し、 シンバル、拍手、密度の高いmix、reverb tail、鋭い子音などで目立ちやすくなります。
| Artifact | 聞こえ方 | よくある原因 |
|---|---|---|
| Pre-echo | 鋭い音や子音が本来より前ににじんで聞こえる | ドラム、拍手、弦のアタック、声の子音 |
| 高域の揺れ | シンバル、残響、空気感が水っぽく揺れる | 低ビットレートと複雑な高域成分 |
| Stereoの縮小 | 広がりのある音が狭く、不安定に聞こえる | 強いjoint stereo処理や低ビットレート |
| 金属的な響き | 音の周囲に薄い金属音が乗る | 強い圧縮やlossy変換の繰り返し |
| こもり | 音の抜けや細部が失われる | 高域情報の削減 |
MP3とWAV、FLAC、AAC、OGG、Opus、M4Aの違い
MP3が常に最適な音声形式というわけではありません。圧縮形式としての互換性は非常に高いですが、 用途によって適した形式は変わります。
| 形式 | 圧縮 | 一般的なサイズ | 互換性 | 向いている用途 |
|---|---|---|---|---|
| MP3 | Lossy | 小さい | 非常に高い | 共有、podcast、音楽ダウンロード、古い環境の互換性 |
| WAV | 非圧縮 | 非常に大きい | 非常に高い | 編集、録音、文字起こし、制作データの受け渡し |
| AIFF | 非圧縮 | 非常に大きい | 高い | Apple寄りの制作・編集ワークフロー |
| FLAC | Lossless圧縮 | 中から大 | 高い | 高品質音源の保存とarchive |
| AAC/M4A | Lossy | 小さい | 非常に高い | モバイル再生、Apple端末、効率的な音楽配信 |
| OGG Vorbis | Lossy | 小さい | 高い | オープンなWeb音声とApple以外のワークフロー |
| Opus | Lossy | 非常に小さい | 高い | 音声、streaming、低遅延、小容量の現代的な音声 |
良いworkflowは、WAV、AIFF、FLACのようなlossless masterを残し、配信用にMP3を作ることです。 そうすれば、すでにlossyになった音源を何度も圧縮し直さずに済みます。
ID3メタデータとアルバムアート
多くのMP3ライブラリは ID3 tag にmetadataを保存します。曲名、アーティスト、 アルバム、track番号、genre、リリース年、歌詞、comment、cover artなどを保存できるため、 音楽アプリでファイル名だけでなく整理された情報として表示できます。
ID3v1は古く制限が多い形式です。ID3v2はより柔軟で、通常ファイルの先頭に置かれるため、 再生開始前にplayerがmetadataを読み取りやすくなります。cover artは便利ですが、 高解像度画像を埋め込むとファイルサイズが大きくなります。
- 曲名、アーティスト名、話者名を明確にする
- アルバムアートは適切なサイズにする
- 公開前に個人的なメモや編集用metadataを削除する
- アルバム、講座、audiobookではtrack番号を統一する
WebでのMP3
MP3はブラウザーで広くサポートされているため、単純なWeb再生に向いています。 基本的なHTMLは次のように書けます。
<audio controls preload="metadata">
<source src="/audio/interview.mp3" type="audio/mpeg" />
<a href="/audio/interview.mp3">MP3をダウンロード</a>
</audio>実運用では、再生できるかだけでなく、ページ容量、モバイル通信量、再生開始までの時間も考える必要があります。 適切なbitrateを選び、cacheを設定し、音付きautoplayは避けましょう。
| MIME type | audio/mpeg は、MP3で一般的に使われるMPEG audio streamの標準media typeです。 |
| HTML再生 | audio 要素を使い、controls、必要に応じたtranscript、代替のダウンロードリンクを用意します。 |
| Streaming | MP3はprogressive downloadに向いていますが、adaptive streamingでは分割形式や新しいcodecが使われることが多いです。 |
| Caching | 安定した音声ファイルには長めのcacheを設定し、差し替えるときはファイル名を変更します。 |
| Accessibility | 音声コンテンツにはtranscriptを用意し、音付きautoplayは避けます。 |
MP3を選ぶべき場面
互換性、配布のしやすさ、小さなファイルサイズが、元録音のすべての細部を保存することより重要な場合、 MP3は良い選択です。
- 端末、アプリ、Webサイトで最大限の再生互換性が必要なとき
- podcast、音声メモ、音楽共有、ダウンロード、Web音声を配布するとき
- 編集用の非圧縮音声が必要なら、MP3ではなくWAVまたはAIFFを選ぶ
- 保存用のlossless圧縮が必要なら、FLACを選ぶ
- 古い環境より現代的な効率を優先するなら、Opus、OGG、AAC、M4Aも検討する
つまり、MP3は配信用形式であり、完全な保存形式ではありません。人に音声を届ける用途には優れていますが、 重要な録音の唯一の高品質コピーとしては不向きです。
MP3変換前のポイント
できるだけ高品質な元ファイルから始めましょう。FLAC、WAV、AIFFからMP3へ変換する方が、 すでに圧縮された音声を再変換するよりきれいな結果になりやすいです。編集する場合は、先に編集を終えてから 最後にMP3を書き出します。
音声だけならmonoと中程度のbitrateで小さくできます。音楽ならstereoで192 kbps以上を目安にするとよいでしょう。 古い端末との互換性を考えるなら、MP3は今でも安全な書き出し先です。
| 変換 | おすすめ度 | 理由 |
|---|---|---|
| FLAC/WAV/AIFFからMP3 | おすすめ | 高品質な元音源から配信用コピーを作るためです。 |
| MP3からWAV/AIFF | 便利だが音質は戻らない | 編集しやすくなりますが、MP3で失われた情報は戻りません。 |
| MP3からMP3 | できるだけ避ける | lossy音声を再encodeすると世代ごとにartifactが増えます。 |
| MP4/MOV/M4V/3GP/WebMからMP3 | 便利 | 動画から音声だけを取り出して、リスニング、podcast、文字起こし、共有に使えます。 |
| MP3からAAC/OGG/Opus | 用途次第 | 形式指定がある場合は便利ですが、両方lossyなので音質が下がることがあります。 |
おすすめの書き出し設定
- podcastや音声コンテンツ: monoまたはstereo、制作品質に応じて96-160 kbps
- 音楽共有: stereo、192-256 kbpsが実用的なバランス
- 高めの音楽配信: stereo、256-320 kbpsまたは高品質VBR preset
- 編集workflow: まずWAVまたはAIFFで書き出し、編集後にMP3を作る
- archive workflow: FLACまたはWAVを保存用、MP3を配信用として持つ
MP3に関するよくある誤解
誤解: MP3をWAVに変換すると音質が良くなる
MP3をWAVに変換すると編集ソフトで扱いやすくなる場合はありますが、MP3圧縮で失われた情報は戻りません。 WAVは大きくなりますが、基本的にはdecodeされたMP3と同じ音です。
誤解: 320 kbps MP3はlosslessである
320 kbpsのMP3はかなり良く聞こえることがありますが、それでもlossyです。数学的にlosslessな音声が必要なら、 FLAC、WAV、AIFFを選びましょう。
誤解: MP3はもう古くて使えない
MP3は新しいcodecより古く、効率で劣ることもあります。しかし互換性という強みは今でも大きいです。 聞き手の端末を選べない場合、MP3は信頼できる配信用形式です。
音声形式を比較
この表から各音声形式のガイドへ移動し、元データ、編集、アーカイブ、配信用途に合う形式を選べます。
| ガイド | 圧縮 | 一般的なサイズ | 互換性 | 向いている用途 |
|---|---|---|---|---|
| MP3 | 非可逆 | 小さい | 非常に高い | 古い環境への対応、簡単なダウンロード、ポッドキャスト、幅広い共有 |
| WAV | 非圧縮PCM | 非常に大きい | 非常に高い | 録音、編集、文字起こし、制作データの受け渡し |
| AAC | 非可逆 | 小さい | 非常に高い | モバイル再生、MP4の音声、効率的な配信 |
| M4A | コンテナ。多くはAACまたはALAC | 小〜中大 | 非常に高い | Apple系の音声、メタデータ、ポッドキャスト、音楽ライブラリ |
| OGG | Oggコンテナ。多くはVorbis | 小さい | 高い | オープン音声、ゲーム、Apple以外のワークフロー、Web再生 |
| OGA | 音声専用Oggコンテナ | さまざま | まちまち | 音声専用Oggファイル、オープンな音声ワークフロー |
| Opus | 非可逆 | 非常に小さい | 高い | 音声、ストリーミング、低遅延、現代的な軽量音声 |
| AIFF | 非圧縮PCM | 非常に大きい | 高い | Apple系の編集、制作、サンプリング |
| FLAC | ロスレス圧縮 | 中〜大 | 高い | アーカイブ、高品質ライブラリ、元データ保存 |
MP3を他の形式に変換
元ファイルがMP3で、WAV、AAC、OGG、Opus、AIFF、M4Aとして書き出したい場合に使います。
音声・動画をMP3に変換
別の音声形式、ロスレス音源、動画ファイルから互換性の高いMP3を作成したい場合に使います。