ElevenLabs 教學 (AI 文字轉語音 TTS 工具)

ElevenLabs 介紹
最後更新於 2026 年 3 月 1 日 – 作者: Lazy Kar
ElevenLabs 是一個 AI 語音平台,從最初的文字轉語音工具,發展成涵蓋語音生成、語音克隆、AI 音樂、語音辨識、AI 語音代理的語音綜合平台。最新推出的 Eleven v3 帶來情感標籤控制系統及多說話者對話生成,語音表現力達到全新高度。
用戶可以在 ElevenLabs 上傳聲音或選擇聲音樣本生成語音。ElevenLabs 提供免費版本和付費版本,免費版本每月提供 10,000 字數的文字轉語音。
ElevenLabs 網址: elevenlabs.io
ElevenLabs 主要功能
文字轉語音(Text to Speech)
- Eleven v3:支援 70+ 種語言,引入情感標籤系統(如 [excited]、[whispers]、[sighs]),可精確控制語氣與情緒,適合影片配音、有聲書及影視製作。即時對話應用建議暫時使用 v2.5 Turbo
- 可調整語速、音調、語氣強度,輸出格式支援 MP3 及多種 WAV 格式。
多說話者對話生成(Text to Dialogue)
- Eleven v3 新增 Text to Dialogue 功能,可在單一音訊檔案中生成多個說話者的自然對話,自動處理說話者轉換、情緒變化及語音重疊,適合製作播客節目、有聲故事或培訓材料。
語音克隆(Voice Cloning)
- 即時語音克隆:上傳短音訊樣本,數秒內生成個人化聲音。
- 專業語音克隆:使用較長音訊樣本訓練,還原度更高,Creator 版起可使用。
AI 音樂生成(Eleven Music)
- 支援以自然語言提示生成任何曲風、結構的原創音樂,訓練數據均已取得授權。
- 付費版提供 Stem Separation 功能,可將生成音樂分離為人聲、鼓、低音等獨立軌道,供專業後期製作使用。免費版可試用音樂生成但不含商業授權。
語音辨識(Speech to Text / Scribe)
- Scribe v2:高準確率語音轉文字模型,支援說話者區分及字元級時間戳記,支援 99 種語言。
- Scribe v2 Realtime:實時語音轉文字,延遲低於 150 毫秒,支援 90 種語言及自動語言偵測,專為語音代理及即時字幕應用設計。
配音與影片整合(Dubbing)
- 支援 AI 自動配音及多語言本地化,可將影片內容翻譯配音至約 70 種語言並保持口型同步
- 平台現已整合 Veo、Sora、Kling、Wan、Seedance 等主流 AI 影片生成工具,實現從影片生成到語音配樂的完整創作流程。
音效與圖像影片生成
- 免費版起支援音效生成(Sound Effects)及圖像影片生成功能,以文字描述即可生成各類音效,適用於影片製作及多媒體內容。
ElevenLabs 使用教學
- 進入 ElevenLabs 網站,以 Google 帳號或電郵免費註冊。
- 登入後,在左側選單選擇所需功能(文字轉語音、配音、音樂、音效等)。
- 在文字輸入框輸入要轉換的內容,從 Model Picker 選擇模型(一般用途選 Eleven v3,即時用途選 Flash)。
- 選擇語言及聲音樣本,可加入情感標籤(如 [whispers]、[excited])控制語氣(Eleven v3 功能)。
- 點擊「Generate」,即可將文字轉換為語音,預覽後下載 MP3 或 WAV 檔案。
ElevenLabs 網址: elevenlabs.io
** 免費版不可用於商業用途,每月僅約 10 分鐘音訊(v2/v3 模型)。
相關文章: 推薦 5 個好用文字轉語音 (TTS) AI 工具
────⋆⋅☆⋅⋆───⋆⋅☆⋅⋆─────
Lazy Kar 精選 AI 工具系列:
────⋆⋅☆⋅⋆───⋆⋅☆⋅⋆─────
👉 Seedance 2.0 教學:即夢 AI 最新影片生成模型
======================
👉 AI 繪圖教學
👉 AI 高效學習
======================
