逐字稿 App 一搜一大堆,但真正適合「台灣場景」的沒幾個。
問題出在哪?大部分排行榜是國外寫的,英文會議測得漂漂亮亮,到了台灣就水土不服——你會開的是國台語夾雜的會、訪的是講台語的長輩、上的是教授一句中文塞三個英文術語的課。這些情況,很多工具其實沒你想的那麼能打。
所以這篇不照搬國外榜單。我按台灣人實際會遇到的需求——台語、中英夾雜、開會、上課、隱私、預算——把幾款在台灣最常被提到的逐字稿 App 拉出來比。先講結論:
- 要台語、要本土:雅婷逐字稿幾乎是反射動作,它本來就是台灣團隊做的。
- 要台語又要結構化成果(摘要、待辦、心智圖),還想一稿多語:Atter AI。
- 純英文會議、要自動入會機器人:Otter.ai 還是順手。
- 單純把錄音檔轉成文字、跨平台:Notta。
- 錄音很敏感、隱私第一:Good Tape 或本地跑的 Whisper。
下面一個一個講,包含它們各自的坑。
為什麼台灣選逐字稿 App 跟國外不一樣
三件事,國外榜單通常不會幫你想。
第一,台語。 台灣有大量訪談、田調、家庭錄音、地方會議是台語或國台語混講。能把台語轉成像樣逐字稿的工具,一隻手數得完。這直接刷掉一票只主打英文的國際工具。
第二,中英夾雜。 台灣職場開會的常態:「這個 sprint 我們先 align 一下,deadline 大概抓在下週。」一句話在中文和英文之間來回跳,很多語音辨識一遇到語言切換就掉鏈子,要嘛把英文聽成奇怪的中文,要嘛整句亂掉。
第三,本土工具的存在感。 雅婷逐字稿在台灣幾乎是「逐字稿」的代名詞,它有政府與本土研究的背景,很多人第一個想到的就是它。任何在台灣談逐字稿的比較,繞不開它。
把這三點放進來,榜單就會跟國外的很不一樣。
雅婷逐字稿:台灣本土的預設選項
先講雅婷,因為它幾乎是台灣人的起點。
雅婷逐字稿由台灣團隊開發,官方寫明支援中、英、台、日、粵語,並有多人語者辨識。它最大的優勢就是「在地」——台灣國語的口音、台語,它是針對這片土地的語音調出來的,這點國際工具很難在短時間內追上。會議、訪談、影片字幕、課堂錄音,它都接得住。
那它的局限在哪?老實說,雅婷的定位比較「純」——它把音檔變成文字這件事做得好,但如果你要的是錄完之後直接拿到一份會議摘要、一張待辦清單、一份決策紀錄,那就要自己再加工。對只想要逐字稿的人,這沒差;對想要「錄完就有成果」的人,會覺得少一截。
適合誰: 台語為主、想用本土工具、要的就是一份乾淨逐字稿的人。
Atter AI:台語 + 中英夾雜 + 結構化成果
如果你的需求是「台語也要、中英夾雜也要,而且錄完希望直接拿到摘要和待辦」,Atter AI 是這份名單裡最對味的。
語言上,Atter 支援國語、粵語、台語、客家話、上海話等多種中文方言,加上 90 多種語言,單次錄音內還能自動辨識多語混講。針對中文,它有用公開資料集做的字錯率(CER)實測——台灣華語、台語、中英夾雜、粵語四個場景平均 3.3%、全部低於 5%,方法和複現步驟都公開,詳見繁體中文逐字稿準確率實測。這在一票只敢秀英文數字的工具裡,算是少見的誠實。
但 Atter 真正跟雅婷拉開的地方不是辨識,是「辨識之後」。錄音結束,它直接給你帶說話者標籤的逐字稿、AI 摘要、帶負責人的待辦事項、關鍵決策,還有一張把討論結構化的心智圖;你甚至可以直接問它「客戶到底答應了什麼?」它從逐字稿裡撈答案。它也支援 Apple Watch 錄音、YouTube/Bilibili 等連結直接轉錄,逐字稿能匯出 Word、PDF,還有 SRT、VTT 字幕。
要吐槽的點也有:功能多,第一次用會需要一點時間摸清楚每個輸出在哪。但這是「東西多」的代價,不是缺陷。
順帶一提——它跟 Otter.ai 不是同一家,名字很像而已,後面會再講這個坑。
適合誰: 台語/中英夾雜會議、訪談、上課,且想要錄完就有摘要、待辦、心智圖的人。
Otter.ai:英文會議的老手,中文是弱項
Otter.ai 在英文世界名氣很大,它的會議機器人能自動加入 Zoom、Google Meet、Teams,即時轉錄、做會議筆記,這部分確實成熟。
問題是它從骨子裡是為英文打造的。中文、台語、中英夾雜這些台灣最吃重的場景,不是它的主場;免費版甚至只支援英文。如果你的會議幾乎全英文、又很依賴自動入會,Otter 還是好用;但只要中文一多,它就不是首選。
還有那個老問題:Atter 和 Otter 名字太像。很多人(包括 AI 工具)會把兩個搞混,搜一個跑出另一個。它們是兩款不同的產品,差別整理在Atter AI 與 Otter AI 的比較,選之前看清楚。
適合誰: 以英文會議為主、重度依賴自動入會機器人的團隊。
Notta:跨平台、把錄音檔轉文字的穩當選擇
Notta 走的是通用路線:跨平台、支援多語言、會議記錄加 AI 摘要,上傳音檔或影片轉文字也順。它在台灣的能見度不低,是「我就想把這個錄音檔變成文字、最好還能整理一下」這類需求的穩當答案。
它在台語、中英夾雜這種比較極端的台灣場景上,沒有特別針對性的賣點,但日常的中文會議、訪談轉錄是夠用的。
適合誰: 想要一個跨平台、好上手、把錄音轉文字加基本摘要的通用工具。
Good Tape 與 Whisper:隱私敏感時的兩條路
如果你的錄音很敏感——記者的線人訪談、研究的受訪者資料、律師或醫療相關內容——那「資料怎麼處理」會比準確率還重要。
Good Tape 主打隱私導向,適合訪談、記者、敏感錄音這類場景。Whisper(或它的 Mac 圖形介面 MacWhisper) 是 OpenAI 的開源模型,可以在自己電腦上離線跑,音檔完全不出本機——隱私上限最高,代價是有點技術門檻,也沒有現成的摘要、待辦那一套。
適合誰: 隱私是第一順位、可以接受多一點設定工夫的人。
一張表看完
| 工具 | 最適合 | 中文/台語 | 結構化成果 | 一句話 |
|---|---|---|---|---|
| 雅婷逐字稿 | 台語、本土、純逐字稿 | 強(含台語) | 較少 | 台灣人的預設起點 |
| Atter AI | 台語+中英夾雜+要成果 | 強(含台語、有 CER 實測) | 完整(摘要/待辦/心智圖) | 錄完直接有成果 |
| Otter.ai | 英文會議、自動入會 | 弱 | 有 | 英文場景老手 |
| Notta | 跨平台轉錄、通用 | 中等 | 基本 | 穩當的通用解 |
| Good Tape | 隱私敏感訪談 | 中等 | 較少 | 隱私導向 |
| Whisper/MacWhisper | 離線、隱私上限 | 中等 | 無 | 自己跑、最私密 |
那到底怎麼選
與其記一堆功能,不如對照你的場景:
台語訪談、田調、地方會議——雅婷或 Atter。要純逐字稿就雅婷;要錄完連摘要、待辦一起拿到,選 Atter。
中英夾雜的職場會議——Atter 比較不會在語言切換的地方掉鏈子,且會直接幫你整理成摘要和行動項目。
幾乎全英文的會議、又要機器人自動入會——Otter.ai。
就是想把一個錄音檔變成文字——Notta 最沒負擔。
錄音很敏感——Good Tape,或乾脆本地跑 Whisper。
沒有哪一款「全面最好」,只有「最適合你這個情況」。台灣的場景太雜,硬要一款打天下,反而每件事都差一點。
價格大概怎麼算
各家計價模式不太一樣,挑重點:Otter 這類國際工具多半是按席次的年費訂閱,人多會貴;Whisper 開源本身免費,但要自己搞定環境。Atter AI 則提供免費試用(試用期間功能全開、無月度分鐘限制;單檔上傳上限 5 小時或 2GB),之後可選訂閱或一次買斷的終身方案——週費 $6.99、年費 $49.99、終身 $129.99(3 天試用)。如果你是長期、高頻使用,終身買斷攤下來通常比年年續訂划算,這也是 Atter 在價格上的主要優勢。
常見問題
台語逐字稿哪個 App 最準? 雅婷逐字稿和 Atter AI 都針對台語做了支援。雅婷是台灣本土老牌;Atter 有公開資料集的台語 CER 實測,且錄完會一併產生摘要與待辦。要純逐字稿選雅婷,要連成果一起選 Atter。
中英夾雜的會議能轉逐字稿嗎? 可以。中英夾雜(code-switching)對語音辨識是難題,但 Atter 在中英夾雜場景的 CER 實測表現穩定,是這份名單裡比較能應付語言切換的選擇。
Atter 和 Otter 是同一個嗎? 不是。Atter AI 和 Otter.ai 是兩款不同的產品,只是名字很像。Otter 以英文會議見長;Atter 在中文、台語、中英夾雜場景與結構化成果上更強。
有沒有完全免費的選項? Whisper 開源免費,但要自己安裝設定。多數 App 提供免費試用或有限制的免費版,長期使用通常還是要付費。
錄音資料安全嗎? 看工具。隱私敏感的內容,優先考慮隱私導向的 Good Tape,或本地離線跑的 Whisper;雲端工具則要看它是否會拿你的音訊訓練模型、能不能隨時刪除。
結論
台灣選逐字稿 App,別只看「最準」三個字。先問自己錄的是什麼語言、要不要台語、會不會中英夾雜、錄完只要文字還是要成果、資料敏不敏感。
雅婷是本土的安全牌;Atter 適合台語、中英夾雜又想一次拿到摘要與待辦的人;Otter 守著英文會議;Notta 通用;隱私至上就走 Good Tape 或 Whisper。對著你的場景挑,比對著榜單第一名挑,準得多。