AOYAMA Koji's PROGRAMMING BLOG

音声圧縮体験ツール

2025/02/23

 オーディオコーデックの記事などで紹介した通り、音声圧縮には色々あります。 本記事では、音声はどのように圧縮されデータが欠落しているのかなど、音声圧縮を体験できるツールを作成したのでご紹介します。


音声圧縮体験ツール




使い方


波形表示


 表示されているのは、音声データの波形です。 青がオリジナル、赤が圧縮後のものです。

合成量と再現度


 合成量を調整することで、音声データの再現度を調整できます。 数字を直接入力するか、矢印を押下して、どのくらいの再現度になるか、視覚的に確認してください。

PLAY


 PLAY ボタンで、赤のグラフの音を実際に再生できます。 音量に注意して、お聞きください。
 最初に読み込まれているのは、私が将棋を指したときの駒音です。 「パチッ」「チッ」などの音が聞こえれば正常に動作しています。

音声ファイル読み込み


 お手元に音声ファイルがあれば、それでも試すことができます。 ファイルをドラッグ&ドロップするか、「参照」ボタンから選択してください。
 ステレオ音源の場合、波形の色は、青と緑がオリジナル、赤とピンクが圧縮後です。

注意事項


 処理はすべて、ご使用のWebブラウザー内で行われます。 読み込まれた音声ファイルが、当サイトや他の方にバレることはありませんのでご安心ください。
 ただし、長い音声の場合は計算に時間がかかりますので、ご注意ください。 マシンパワーにもよりますが、長くても数秒程度の音声データでお試しください。

合成量と再現度の補足



 合成量の初期値は10%程度、それが10000を超えた場合は10000にしています。
 その状態では、見た目での一致度があまり高くありませんが、 PLAYで実際に聴いてみると、それなりに聞こえるのがわかります。
 そこから合成量を増やしていくと、 だんだんと元データ(青線)に近づいていくのがわかります。 逆に見た目が近いのに音はかなり違う場合もありますね。
 せひ色々とお試しください。

フーリエ変換を使用


 本ツールで用いた主要な技術は、古くから存在するフーリエ変換です。 元データをフーリエ変換で周波数成分に分解し、重要度の大きいものから順に合成量の数だけ合成しています。 最新の音声圧縮技術とは異なりますが、音声圧縮の基本的な考え方を体験するには適しているでしょう。

まとめ


 本記事では、音声の圧縮を体験できるツールを紹介しました。 ここで使用したフーリエ変換を含め、関連技術については、次の記事以降で順次解説します。

補足

・本記事のフーリエ変換後のデータ量は元データの倍以上のため、合成量の割合と圧縮率はイコールではありません。
・(公開後)WAVファイル以外の音声ファイルの読み込みに対応し、記事内容を細かく改修しました。
・(公開後)初期合成量最大を1000から10000に変更しました。

カテゴリー:オーディオ推し,アプリケーション
著者プロフィール
青山公士(あおやま こうじ)
中学2年生からゲームプログラミングに明け暮れる。ゲーム開発者としての代表作に「スーパー桃太郎電鉄II」(ハドソン)メインプログラマー、[PR]『ドラゴンクエストX オンライン』(スクウェア・エニックス)テクニカルディレクター/プロデューサーなどがある。[PR]「ドラゴンクエストXを支える技術」(技術評論社)著者。本ブログは今までの経験を活かしプログラミングが楽しいと感じる人が少しでも増えるようなものにしたい。 @kojibm
株式会社ロジック推し
推し情報を論理的にわかりやすく紹介することで「世の中をちょっと楽しく」をミッションに活動中。 HP X Instagram
privacy policy
ピックアップ
Loading...
最新記事
Loading...
関連記事
Loading...