cd stt_project/backend
pip install -r requirements.txt- 複製環境變數範本:
cd .. # 回到 stt_project 目錄
cp .env.example .env- 編輯
.env檔案,填入您的雅婷 API Key:
nano .env將 your_api_key_here 替換為您的實際 API Key:
YATING_API_KEY=您的API金鑰
使用啟動腳本(推薦):
./start.sh或手動啟動:
cd backend
python main.py開啟瀏覽器訪問:
http://localhost:8000
- 前往 雅婷開發者平台
- 註冊或登入帳號
- 在控制台中建立新專案
- 複製產生的 API Key
- 支援拖放上傳或點擊選擇檔案
- 支援格式:MP3, WAV, MOV, MP4
- 點擊檔案列表中的「開始辨識」按鈕
- 選擇模型(中英文/中台語)
- 設定說話者數量(可自動偵測)
- 可選擇啟用情緒分析
- 系統自動每 5 秒更新辨識狀態
- 完成後可下載 TXT 或 CSV 格式
- 點擊「查看」可在網頁上查看完整逐字稿
A: 檢查 API Key 是否正確設定在 .env 檔案中。
A: 這是正常的,根據音檔長度,辨識可能需要數分鐘。系統會自動更新狀態。
A: 雅婷 API 的檔案和結果會在 24 小時後自動過期,請重新上傳檔案。
A: 可以,但雅婷 API 限制最多同時 3 個辨識任務。
- Python 3.8+
- 網路連線(需要連接雅婷 API)
- 現代瀏覽器(Chrome, Firefox, Safari, Edge)
查看完整說明文件:README.md