Last Update :

MP3 技 術 縱 覽 ( 中 文 修 訂 版 1.3 )

MP3 就 是 *MPEG 第 1 號 標 準 第 三 資 訊 層 ( MPEG 1 - Layer 3 ) 的 簡 稱 。

MP3 是 一 個 聲 音 壓 縮 的 新 格 式 ﹐ 這 種 格 式 是 最 新 的 研 究 成 果 ﹐ 目 的 是 以 最 少 的 資 料 去 保 存 最 傳 真 的 聲 音 。

近 年 來 MP3 大 行 其 道 ﹐ 因 為 它 不 但 是 一 個 國 際 認 可 的 標 準 ( ISO Standard ) ﹐ 而 且 還 有 很 完 整 的 編 碼 ( Encode ) 和 解 碼 ( Decode ) 資 料 和 實 例 ﹐ 又 有 硬 件 廠 商 支 援 ﹐ 所 以 發 展 得 十 分 迅 速 。

MP3 的 內 裏 技 術 搏 大 精 深 ﹐ 但 其 實 原 理 不 算 複 雜 ﹐ 要 理 解 其 運 作 也 不 是 很 難 ﹐ 只 不 過 在 互 聯 網 上 一 找 之 下 ﹐ 竟 然 沒 有 像 樣 的 中 文 解 釋 ﹐ 名 詞 沒 有 ﹑ 原 理 也 沒 有 ﹐ 盜 版 的 MP3 軟 件 及 歌 曲 下 載 倒 是 很 多 ! 難 得 找 到 的 資 料 ﹐ 也 是 以 德 國 語 和 英 語 為 主 ﹐ 用 語 亦 相 當 艱 深 ( 太 多 專 有 名 詞 ) ﹐ 對 於 一 些 外 語 和 電 腦 名 詞 認 識 不 深 的 朋 友 來 說 閱 讀 起 來 很 是 不 便 ﹐ 因 小 弟 也 閒 時 在 MP3 的 討 論 區 向 外 國 的 板 友 討 論 和 請 教 ﹐ 略 有 心 得 ﹐ 於 是 便 起 了 念 頭 以 中 文 來 解 釋 及 翻 譯 一 些 MP3 技 術 的 文 章 。

本 篇 資 料 大 部 份 取 自 MP3'Tech 及 ﹐ 亦 有 些 從 http://www.r3mix.net 的 留 言 版 ( 一 個 數 碼 音 響 技 術 的 討 論 區 , 已 被 http://www.hydrogenaudio.org 取 代 ) , 以 及 Fraunhofer IIS 學 院 摘 下 ﹐ 謹 此 致 謝 。

甚 麼 是 知 覺 編 碼 ( Perceptual coding ) ?

所 謂 的 知 覺 編 碼 就 是 以 人 類 耳 朵 可 感 覺 到 的 聲 音 來 作 為 編 碼 的 基 礎 ﹐ 在 MP3 內 指 的 就 是 聽 覺 訊 號 。

以 下 是 知 覺 編 碼 有 關 的 方 法 :

1) 最 小 可 聆 聽 範 圍 ( Minimum audition threshold )

人 類 的 聆 聽 範 圍 其 實 並 不 是 線 性 的 ﹐ 其 實 有 不 少 聲 音 是 聽 不 到 的 ﹐ 例 如 從 2 Khz 到 5 Khz ﹐ 耳 朵 聽 不 到 的 聲 音 便 可 剔 除 。

2) 掩 蓋 效 果 ( Masking effect )

掩 蓋 效 果 是 針 對 人 類 聽 覺 的 特 色 『 聲 音 掩 蓋 』 。

當 有 爆 炸 的 聲 音 時 ﹐ 我 們 只 會 聽 見 爆 炸 而 聽 不 見 其 它 的 聲 音 ﹐ 因 為 爆 炸 聲 音 的 能 量 太 大 ﹐ 其 它 聲 音 被 蓋 過 了 的 緣 故 。 例 如 在 演 奏 交 響 樂 時 ﹐ 一 些 聲 音 大 的 樂 器 會 把 其 它 遮 蓋 了 ﹐ 在 編 碼 時 只 要 使 用 一 種 『 心 理 聲 學 ( Phycoaucostic Model ) 』 的 方 法 令 電 腦 可 以 模 擬 人 類 耳 朵 ﹐ 把 能 量 最 大 的 聲 音 編 碼 ﹐ 而 其 它 被 蓋 過 了 的 聲 音 除 掉 就 可 以 省 去 去 多 儲 存 空 間 。其 它 以 電 腦 技 術 節 省 儲 存 空 間 的 方 法 還 有 :

1) 小 暫 存 區 ( Short reservoir of bytes )

小 暫 存 區 的 目 的 是 - 盡 可 能 在 有 限 的 檔 案 大 小 ﹐ 保 存 更 多 的 資 料 。 原 理 就 是 ﹐ 當 進 行 MP3 壓 縮 編 碼 時 ﹐ 在 指 定 的 bitrate 內 ﹐ 某 些 聲 音 由 於 簡 單 ﹐ 聲 音 在 編 碼 後 佔 的 byte 數 目 較 少 ﹐ 多 出 來 的 空 間 就 可 以 成 為 一 個 暫 存 區 ﹐ 到 了 遇 到 一 些 複 雜 的 聲 音 要 編 碼 ﹐ 編 碼 多 出 來 的 資 料 就 可 以 放 在 暫 存 區 內 ﹐ 這 樣 做 的 好 處 是 盡 量 保 留 數 碼 化 後 的 音 樂 資 料 ﹐ 編 碼 愈 完 整 則 重 播 時 愈 傳 真 。

2) 霍 夫 曼 編 碼 ( Huffman coding )

霍 夫 曼 編 碼 能 有 效 地 將 MP3 內 重 複 出 現 的 數 碼 音 樂 進 行 再 壓 縮 ﹐ 這 樣 能 省 下 不 少 硬 盤 儲 存 空 間 ﹐ 同 時 由 於 霍 夫 曼 編 碼 十 分 有 效 率 ﹐ 不 會 對 讀 取 MP3 及 解 壓 做 成 延 遲 及 對 CPU 帶 來 額 外 工 作 負 擔 。

3) 共 用 式 立 體 聲 ( Joint stereo )

將 左 右 聲 道 的 資 料 分 析 ﹐ 進 行 **MS-Stereo 及 Intensity Stereo 編 碼 。

MS-Stereo 內 容 大 約 是 把 左 右 聲 道 的 資 料 比 較 ﹐ 將 中 央 聲 道 [ 左 + 右 ] 和 兩 側 聲 道 [ 左 - 右 ] 分 開 編 碼 ﹐ 好 處 是 兩 側 編 碼 後 的 byte 會 較 少 ﹐ 在 播 放 時 只 要 把 所 有 聲 道 資 料 還 原 就 可 以 。

Intensity Stereo 是 針 對 一 些 特 別 高 或 低 的 聲 音 頻 率 作 編 碼 。 例 子 是 超 低 音 揚 聲 器 ﹐ 通 常 都 只 用 一 個 而 不 是 兩 個 ﹐ 這 是 因 為 人 類 的 耳 朵 對 於 某 程 度 上 的 低 音 ﹐ 再 也 分 不 到 音 源 在 左 或 右 。 所 以 把 那 種 頻 率 的 聲 音 ﹐ 使 用 單 聲 道 ( Monophonic ) 去 編 碼 ﹐ 再 加 上 很 少 的 左 右 聲 道 資 料 便 成 。


注 :

*Motion Picture Experts Group - 移 動 圖 像 專 家 小 組

**Mid-Side Stereo 簡 稱 MS-Stereo ﹐ 詳 細 資 料 可 參 考 PAiA Electronics, Inc 公 司 的 網 頁 : http://www.paia.com/ProdArticles/msmicwrk.htm