/13分で読めます

MP3とは?音声圧縮、ビットレート、音質、MP3変換ツールを解説

MP3はWebで最もよく知られている圧縮音声形式のひとつです。ファイルサイズが小さく、共有しやすく、ほとんどの環境で再生できるため、スタジオ品質より互換性を優先したい場面で今でも役立ちます。

今すぐMP3を変換しますか?

メインのAudio Converterを使うと、複数のMP3ファイルをまとめて変換し、ビットレート、サンプルレート、mono/stereo出力を調整できます。処理はブラウザー内で行われ、ファイルはお使いの端末に残ります。

Audio Converterを開く

MP3ファイルとは?

MP3は MPEG-1 Audio Layer III の略です。音楽や音声ファイルを raw PCM音声より大幅に小さくしながら、日常的なリスニングに十分な聞きやすさを保つために作られた 圧縮デジタル音声形式です。MP3ファイルは通常 .mp3拡張子を持ち、Webでは audio/mpeg として配信されることが多いです。

MP3は lossy 形式です。つまり、encoderは元の音声から一部の情報を意図的に削除します。 ZIPやFLACのようなlossless圧縮とは違い、MP3をdecodeしても元の波形を完全には復元できません。 MP3の価値は、小さいファイルサイズ、速い転送、ほぼどこでも再生できる互換性のバランスにあります。

このバランスにより、MP3は長い間デジタル音楽の共通語になりました。適切に設定されたMP3は小さく、 streamしやすく、ダウンロードも速く、ブラウザー、スマートフォン、車載オーディオ、スマートスピーカー、 動画編集ソフト、古いメディアプレーヤーでも再生しやすい形式です。

MP3の簡単な歴史

MP3は初期のインターネット時代に有名になりましたが、その背景には知覚音声符号化の長い研究があります。 研究者たちは、非圧縮CD音声よりはるかに少ないデータ量で高品質な音楽を保存・送信する方法を探していました。

この形式はMPEG Audioの一部として標準化され、実用上の問題を解決したことで急速に広まりました。 1曲分の音声を、遅いインターネット回線や小さなハードディスクでも扱えるサイズにできたからです。

時期主な出来事
1980年代Fraunhofer IISや協力機関の研究者が、MPEG Audioにつながる知覚音声符号化技術を開発しました。
1992-1993年MPEG-1 AudioがISO/IEC 11172-3として標準化され、Layer I、Layer II、Layer IIIが含まれました。
1995年.mp3という拡張子が選ばれ、一般ユーザーにも覚えやすい形式になりました。
1990年代後半携帯音楽プレーヤー、ファイル共有、CDリッピング、初期のWebダウンロードにより、MP3はデジタル音楽の象徴になりました。
2000年代MP3はOS、携帯電話、ブラウザー、編集ソフト、音楽ライブラリで標準的な書き出し・再生形式になりました。
現在新しいcodecの方が効率的な場合もありますが、MP3は互換性を重視する実用的な形式として残っています。

MP3はユーザーの期待も変えました。音声はディスクやテープ、大きなファイルに縛られるものではなくなり、 検索でき、ダウンロードでき、持ち運べて、端末間で簡単に移せるものになりました。

MP3圧縮の仕組み

MP3圧縮は psychoacoustics、つまり人間が音をどう知覚するかに基づいています。 encoderは単にbyteを小さくするのではなく、音声を分析し、聞こえにくい情報を予測して、 重要な部分にbitを多く割り当てます。

MP3 encodingを単純化すると、次のような流れです。

  1. 音声を小さなframeに分割する
  2. 時間方向のsampleを周波数情報へ変換する
  3. psychoacoustic modelでmaskingや聴覚閾値を推定する
  4. 聞こえにくい情報をより強くquantizeする
  5. 残った情報をMPEG audio bitstreamとして格納する

重要なのはmaskingです。大きな音は、時間や周波数が近い小さな音を隠すことがあります。 例えば強いsnareの音は、その周辺の細かな成分を聞こえにくくします。MP3はこの性質を利用して、 気づきにくい情報に使うbitを減らします。

そのためMP3は、元音源に近く聞こえながらファイルサイズを大きく減らせます。ただし、lossy音声を 再encodeするたびに情報がさらに失われるため、作業用masterとしては向いていません。

MP3ファイルの中身

MP3はMP4、MOV、WebMのようなcontainerとは少し違います。一般的なMP3はMPEG audio frameの連続で、 その前後にmetadata tagが付くことがあります。

+------------------------------+
| Optional ID3v2 tag           |  曲名、アーティスト、アルバム、カバー画像
+------------------------------+
| MPEG audio frame             |
| MPEG audio frame             |  encodeされた音声データ
| MPEG audio frame             |
| ...                          |
+------------------------------+
| Optional ID3v1 tag           |  末尾にある古いmetadata block
+------------------------------+

各frameには小さなheaderと圧縮音声データが含まれます。headerにはMPEG version、layer、 bitrate、sample rate、channel mode、paddingの有無など、decodeに必要な情報が入っています。

frame構造のおかげで、MP3はファイル全体のダウンロードが終わる前に再生を始めやすい形式です。 これは初期のWeb音声で特に便利で、今でもpodcast、preview、ダウンロード用音声に向いています。

MP3のビットレートと音質

ビットレートは、1秒あたりに使えるbit数です。高いビットレートは一般に音質が良く、ファイルサイズも大きくなります。 低いビットレートは容量を節約できますが、シンバルの揺れ、transientの鈍さ、stereoの不安定さ、 声のにじみなどのartifactが出やすくなります。

ビットレート向いている用途トレードオフ
64-96 kbps音声メモ、文字起こし用音声、低帯域のプレビュー非常に小さいが、音楽では劣化が目立ちやすい
128 kbps古い音楽ライブラリ、手早い共有普段使いには許容できるが、artifactが聞こえやすい
160-192 kbps一般的なリスニング、podcast、Webダウンロードサイズと音質のバランスがよい
224-256 kbps劣化を抑えた音楽共有ファイルは大きくなるが、transientやstereo感が改善しやすい
320 kbps一般的なMP3の最高クラスの固定ビットレート書き出しMP3としては大きいが、それでもlossy

ファイルサイズは次の式でおおよそ計算できます。

ファイルサイズ(MB) = (bitrate(kbps) * 長さ(秒)) / 8 / 1024

例: 192 kbps * 180秒 / 8 / 1024 = 約4.2 MB

音質を決めるのはビットレートだけではありません。encoderも重要です。新しいencoderは、 同じビットレートでも古いencoderや設定の悪いencoderより良い結果を出せることがあります。

CBRとVBR

MP3には constant bitratevariable bitrate があります。 どちらも一般的ですが、向いている目的が違います。

CBR: 固定ビットレート

CBRはファイル全体で同じビットレートを使います。streaming、broadcasting、単純なサイズ見積もりには便利ですが、 簡単な部分にbitを使いすぎ、複雑な部分で足りなくなることがあります。

VBR: 可変ビットレート

VBRは複雑な部分に多く、単純な部分に少ないbitを使います。同じ平均サイズなら音質が良くなりやすい一方、 最終的なファイルサイズは正確に予測しにくくなります。

サンプルレート、チャンネル、ファイルサイズ

サンプルレートは、encode前に1秒あたり何個の音声sampleを扱うかを表します。MP3では CD audioで使われる 44.1 kHz や、動画制作でよく使われる48 kHz が一般的です。

多くの音楽では、元音源のサンプルレートを保つのが自然です。44.1 kHzから48 kHzへ、 またはその逆へresampleしても、それだけで音質が良くなるわけではありません。 音声のみなら低いsample rateやmonoでサイズを減らせますが、設定を下げすぎると聞き疲れしやすくなります。

  • Mono は音声メモ、講義、インタビュー、電話風の録音に向いています。
  • Stereo は音楽、環境音、左右の定位が重要な音に向いています。
  • Joint stereo はstereo情報を効率よく保存でき、MP3 encoderでよく使われます。

MP3でよくある音の劣化

Artifactとは、encodingによって生じる望ましくない音です。低ビットレート、変換の繰り返し、 シンバル、拍手、密度の高いmix、reverb tail、鋭い子音などで目立ちやすくなります。

Artifact聞こえ方よくある原因
Pre-echo鋭い音や子音が本来より前ににじんで聞こえるドラム、拍手、弦のアタック、声の子音
高域の揺れシンバル、残響、空気感が水っぽく揺れる低ビットレートと複雑な高域成分
Stereoの縮小広がりのある音が狭く、不安定に聞こえる強いjoint stereo処理や低ビットレート
金属的な響き音の周囲に薄い金属音が乗る強い圧縮やlossy変換の繰り返し
こもり音の抜けや細部が失われる高域情報の削減

MP3とWAV、FLAC、AAC、OGG、Opus、M4Aの違い

MP3が常に最適な音声形式というわけではありません。圧縮形式としての互換性は非常に高いですが、 用途によって適した形式は変わります。

形式圧縮一般的なサイズ互換性向いている用途
MP3Lossy小さい非常に高い共有、podcast、音楽ダウンロード、古い環境の互換性
WAV非圧縮非常に大きい非常に高い編集、録音、文字起こし、制作データの受け渡し
AIFF非圧縮非常に大きい高いApple寄りの制作・編集ワークフロー
FLACLossless圧縮中から大高い高品質音源の保存とarchive
AAC/M4ALossy小さい非常に高いモバイル再生、Apple端末、効率的な音楽配信
OGG VorbisLossy小さい高いオープンなWeb音声とApple以外のワークフロー
OpusLossy非常に小さい高い音声、streaming、低遅延、小容量の現代的な音声

良いworkflowは、WAV、AIFF、FLACのようなlossless masterを残し、配信用にMP3を作ることです。 そうすれば、すでにlossyになった音源を何度も圧縮し直さずに済みます。

ID3メタデータとアルバムアート

多くのMP3ライブラリは ID3 tag にmetadataを保存します。曲名、アーティスト、 アルバム、track番号、genre、リリース年、歌詞、comment、cover artなどを保存できるため、 音楽アプリでファイル名だけでなく整理された情報として表示できます。

ID3v1は古く制限が多い形式です。ID3v2はより柔軟で、通常ファイルの先頭に置かれるため、 再生開始前にplayerがmetadataを読み取りやすくなります。cover artは便利ですが、 高解像度画像を埋め込むとファイルサイズが大きくなります。

  • 曲名、アーティスト名、話者名を明確にする
  • アルバムアートは適切なサイズにする
  • 公開前に個人的なメモや編集用metadataを削除する
  • アルバム、講座、audiobookではtrack番号を統一する

WebでのMP3

MP3はブラウザーで広くサポートされているため、単純なWeb再生に向いています。 基本的なHTMLは次のように書けます。

<audio controls preload="metadata">
  <source src="/audio/interview.mp3" type="audio/mpeg" />
  <a href="/audio/interview.mp3">MP3をダウンロード</a>
</audio>

実運用では、再生できるかだけでなく、ページ容量、モバイル通信量、再生開始までの時間も考える必要があります。 適切なbitrateを選び、cacheを設定し、音付きautoplayは避けましょう。

MIME typeaudio/mpeg は、MP3で一般的に使われるMPEG audio streamの標準media typeです。
HTML再生audio 要素を使い、controls、必要に応じたtranscript、代替のダウンロードリンクを用意します。
StreamingMP3はprogressive downloadに向いていますが、adaptive streamingでは分割形式や新しいcodecが使われることが多いです。
Caching安定した音声ファイルには長めのcacheを設定し、差し替えるときはファイル名を変更します。
Accessibility音声コンテンツにはtranscriptを用意し、音付きautoplayは避けます。

MP3を選ぶべき場面

互換性、配布のしやすさ、小さなファイルサイズが、元録音のすべての細部を保存することより重要な場合、 MP3は良い選択です。

  • 端末、アプリ、Webサイトで最大限の再生互換性が必要なとき
  • podcast、音声メモ、音楽共有、ダウンロード、Web音声を配布するとき
  • 編集用の非圧縮音声が必要なら、MP3ではなくWAVまたはAIFFを選ぶ
  • 保存用のlossless圧縮が必要なら、FLACを選ぶ
  • 古い環境より現代的な効率を優先するなら、Opus、OGG、AAC、M4Aも検討する

つまり、MP3は配信用形式であり、完全な保存形式ではありません。人に音声を届ける用途には優れていますが、 重要な録音の唯一の高品質コピーとしては不向きです。

MP3変換前のポイント

できるだけ高品質な元ファイルから始めましょう。FLAC、WAV、AIFFからMP3へ変換する方が、 すでに圧縮された音声を再変換するよりきれいな結果になりやすいです。編集する場合は、先に編集を終えてから 最後にMP3を書き出します。

音声だけならmonoと中程度のbitrateで小さくできます。音楽ならstereoで192 kbps以上を目安にするとよいでしょう。 古い端末との互換性を考えるなら、MP3は今でも安全な書き出し先です。

変換おすすめ度理由
FLAC/WAV/AIFFからMP3おすすめ高品質な元音源から配信用コピーを作るためです。
MP3からWAV/AIFF便利だが音質は戻らない編集しやすくなりますが、MP3で失われた情報は戻りません。
MP3からMP3できるだけ避けるlossy音声を再encodeすると世代ごとにartifactが増えます。
MP4/MOV/M4V/3GP/WebMからMP3便利動画から音声だけを取り出して、リスニング、podcast、文字起こし、共有に使えます。
MP3からAAC/OGG/Opus用途次第形式指定がある場合は便利ですが、両方lossyなので音質が下がることがあります。

おすすめの書き出し設定

  • podcastや音声コンテンツ: monoまたはstereo、制作品質に応じて96-160 kbps
  • 音楽共有: stereo、192-256 kbpsが実用的なバランス
  • 高めの音楽配信: stereo、256-320 kbpsまたは高品質VBR preset
  • 編集workflow: まずWAVまたはAIFFで書き出し、編集後にMP3を作る
  • archive workflow: FLACまたはWAVを保存用、MP3を配信用として持つ

MP3に関するよくある誤解

誤解: MP3をWAVに変換すると音質が良くなる

MP3をWAVに変換すると編集ソフトで扱いやすくなる場合はありますが、MP3圧縮で失われた情報は戻りません。 WAVは大きくなりますが、基本的にはdecodeされたMP3と同じ音です。

誤解: 320 kbps MP3はlosslessである

320 kbpsのMP3はかなり良く聞こえることがありますが、それでもlossyです。数学的にlosslessな音声が必要なら、 FLAC、WAV、AIFFを選びましょう。

誤解: MP3はもう古くて使えない

MP3は新しいcodecより古く、効率で劣ることもあります。しかし互換性という強みは今でも大きいです。 聞き手の端末を選べない場合、MP3は信頼できる配信用形式です。

音声形式を比較

この表から各音声形式のガイドへ移動し、元データ、編集、アーカイブ、配信用途に合う形式を選べます。

ガイド圧縮一般的なサイズ互換性向いている用途
MP3非可逆小さい非常に高い古い環境への対応、簡単なダウンロード、ポッドキャスト、幅広い共有
WAV非圧縮PCM非常に大きい非常に高い録音、編集、文字起こし、制作データの受け渡し
AAC非可逆小さい非常に高いモバイル再生、MP4の音声、効率的な配信
M4Aコンテナ。多くはAACまたはALAC小〜中大非常に高いApple系の音声、メタデータ、ポッドキャスト、音楽ライブラリ
OGGOggコンテナ。多くはVorbis小さい高いオープン音声、ゲーム、Apple以外のワークフロー、Web再生
OGA音声専用Oggコンテナさまざままちまち音声専用Oggファイル、オープンな音声ワークフロー
Opus非可逆非常に小さい高い音声、ストリーミング、低遅延、現代的な軽量音声
AIFF非圧縮PCM非常に大きい高いApple系の編集、制作、サンプリング
FLACロスレス圧縮中〜大高いアーカイブ、高品質ライブラリ、元データ保存

MP3を他の形式に変換

元ファイルがMP3で、WAV、AAC、OGG、Opus、AIFF、M4Aとして書き出したい場合に使います。

音声・動画をMP3に変換

別の音声形式、ロスレス音源、動画ファイルから互換性の高いMP3を作成したい場合に使います。

WAVMP3WAVからMP3への変換WAV音声ファイルをMP3に変換し、より多くのアプリや端末で再生しやすくします。AACMP3AACからMP3への変換AAC音声ファイルをMP3に変換し、より多くのアプリや端末で再生しやすくします。M4AMP3M4AからMP3への変換M4A音声ファイルをMP3に変換し、より多くのアプリや端末で再生しやすくします。OGGMP3OGGからMP3への変換OGG音声ファイルをMP3に変換し、より多くのアプリや端末で再生しやすくします。OPUSMP3OpusからMP3への変換Opus音声ファイルをMP3に変換し、より多くのアプリや端末で再生しやすくします。AIFFMP3AIFFからMP3への変換AIFF音声ファイルをMP3に変換し、より多くのアプリや端末で再生しやすくします。OGAMP3OGAからMP3への変換OGA音声ファイルをMP3に変換し、より多くのアプリや端末で再生しやすくします。WEBMMP3WebMからMP3への変換WebMファイルから音声を取り出し、互換性の高いMP3として保存します。MP4MP3MP4からMP3への変換MP4ファイルから音声を取り出し、互換性の高いMP3として保存します。MOVMP3MOVからMP3への変換MOVファイルから音声を取り出し、互換性の高いMP3として保存します。M4VMP3M4VからMP3への変換M4Vファイルから音声を取り出し、互換性の高いMP3として保存します。3GPMP33GPからMP3への変換3GPファイルから音声を取り出し、互換性の高いMP3として保存します。FLACMP3FLACからMP3への変換FLAC音声ファイルをMP3に変換し、より多くのアプリや端末で再生しやすくします。

参考資料

  1. MPEG. MPEG-1: Audio, ISO/IEC 11172-3.
  2. IETF RFC 3003. The audio/mpeg Media Type.
  3. Fraunhofer IIS. 30 Years of .mp3: Three Letters That Changed the World.
  4. MDN Web Docs. Web audio codec guide.
  5. MDN Web Docs. Media container formats.
  6. ID3.org. ID3v2.3.0 informal standard.
USTHJP