📍 工作流摘要:Gemini → 剪映文稿匹配 → 雙語字幕

CleanShot 2025-10-18 at 19.27.57@2x.jpg

<aside> <img src="/icons/battery-charging_green.svg" alt="/icons/battery-charging_green.svg" width="40px" />

成果範例(黃色 剪映語音辨識;白色 AI 字幕辨識;最下方 人工版本)

他 她 它 能分辨

他 她 它 能分辨

自動替中英文加上半形空格

自動替中英文加上半形空格

專有名詞也沒問題

專有名詞也沒問題

刪除無意義的語助詞

刪除無意義的語助詞

語意正確性

語意正確性

<aside> 💯

長句子正確節奏分段(甚至超過人工)

CleanShot 2025-10-18 at 21.28.56@2x.jpg

CleanShot 2025-10-18 at 21.29.15@2x.jpg

CleanShot 2025-10-18 at 22.29.51@2x.jpg

</aside>

</aside>

工作流 A:直接丟音檔讓 AI 輸出文字稿

  1. 打開 Google AI Studio;選擇 Google Gemini 2.5 Pro 模型

  2. 上傳音檔(mp3),輸入以下 Prompt 提示詞(可自行微調)

    理解全文原意的基礎上,校正語音轉文字的錯誤,使用繁體中文輸出,我要做為影片字幕用,請符合以下輸出原則:
    
    1. 為了影片閱讀節奏,每一行不超過 18 個中文字,換行時每一行要做到完整句,自然不突兀,去除所有標點符號;當一行的字數過長超過 10 個字,但還不需要換行,你可以在語氣合理的地方加上半形空格,例如:"這是我的知識邊界 我的喜好"
    
    2. 記住中文排版的原則:當中文字遇到英文和數字時,要加上一個半形空格,讓閱讀體驗更舒服,例如:我有 3 台 iPhone 手機;保留專業術語的英文正確寫法和縮寫,例如 FLAC,JPEG,Notion, n8n
    
    3. 你的目的是讓字幕更直觀好閱讀,刪除冗餘無意義的語氣詞,但保有講者的情緒;請記得保持原意不變,例如以下語氣詞可視情況刪除:「那」、「欸」、「哈哈哈」、「對吧」、「嘛」、「然後」
    
    4. 當你判斷我是不是在講人,而在講 AI 或 LLM 時,不要用「他」或「她」,而是用「它」。
    
    
  3. 開啟剪映,使用「文稿匹配」功能,將文字轉為帶時間碼的 SRT

    CleanShot 2025-10-18 at 20.59.26@2x.jpg

  4. 快速播放校正,準確度應該有 98% 以上,然後就能輸出 SRT 檔案:

    CleanShot 2025-10-18 at 21.19.11@2x.jpg

<aside> ⚠️

目前限制:剪映文稿匹配功能,一次只能 5000 字,超過 5000 字要分成兩次。

工作流 B:先確認整體內容摘要,條列錯誤給 AI 學習

適合專有名詞較多的內容,先進行第一批校正

  1. 先確認整體內容摘要&快速條列錯字給 AI,讓 AI 挑出有疑問的地方,幫助他學習(1 mins

    請你先理解我上傳給你的音檔內容的原意、幫我做個列點式的逐字稿內容摘要,並把你認為有疑惑的地方特別告訴我,讓我先和你對齊,你是否能理解內容&專有名詞。我閱讀後會先給你校正建議,之後再讓你生成完整的逐字稿,我要做為字幕用。
    
    記住中文排版的原則:當中文字遇到英文和數字時,要加上一個半形空格,讓閱讀體驗更舒服,例如:我有 3 台 iPhone 手機;保留專業術語的英文正確寫法和縮寫,例如 FLAC,JPEG,Notion, n8n
    

    CleanShot 2025-10-18 at 21.20.53@2x.jpg

    CleanShot 2025-10-18 at 21.21.10@2x.jpg

  2. 直接根據 AI 回覆,給予建議修正(5 mins

    非常好!幾乎都很正確!
    
    有幾個要校正:
    
    1. 「Kemba 模式」是「Canva 模式」,沒有 s,這是 ChatGPT 的一個功能。
    
    2. 「Cloud 公司」是「Claude 公司」。
    
    3. 「城市碼」 是 「程式碼」
    
    4. 如果出現 "紙尿褲" 通常是講 "資料庫"(AI 辨識語音時的常見錯誤)
    
    最後請輸出完整逐字稿,你的目的是讓字幕更直觀好閱讀:為了影片閱讀節奏,每一行不超過 18 個中文字,換行時每一行要做到完整句,自然不突兀,去除所有標點符號;當一行的字數過長超過 10 個字,但還不需要換行,你可以在語氣合理的地方加上半形空格,例如:"這是我的知識邊界 我的喜好"刪除冗餘無意義的語氣詞,但保有講者的情緒;請記得保持原意不變,例如以下語氣詞可視情況刪除:「那」、「欸」、「哈哈哈」、「對吧」、「嘛」、「然後」