逐字稿

iPhone 語音備忘錄逐字稿:iOS 18 能做什麼、不能做什麼

iOS 18 內建了語音備忘錄轉錄,但只支援 12 種語言、沒有講者標記。本文告訴你怎麼補足這些不足。

語音備忘錄大概是全世界使用最廣的錄音 App——預裝在 2026 年大約 22 億支活躍 iPhone 上——但長久以來它只會給你一個 .m4a 檔,其他什麼都沒有。2024 年 9 月 iOS 18 終於加入了 App 內的逐字稿頁籤,可是上線時就帶了幾條硬天花板:只支援 13 種語言、只能本機處理還綁特定 iPhone 硬體、逐字稿文字本身不能匯出。兩年後到了 iOS 26,這些天花板抬高了一點,可是依然存在。

這篇指南整理 2026 年 Apple 內建語音轉文字實際做得到什麼、語音備忘錄在 iPhone / iPad / Mac / Apple Watch 四個平台分別把檔案存在哪裡,以及怎麼用 AI 轉錄管線把任何一段語音備忘錄轉成 90+ 語言、98.7% 準確率的可編輯逐字稿——不管你的 iOS 版本多舊。

iPhone 語音備忘錄到底錄成什麼

每段錄音都是 .m4a 檔,AAC 壓縮、單聲道,品質在 設定 → 語音備忘錄 → 音訊品質 二選一:

設定取樣率位元率60 分鐘檔案大小
壓縮(預設)32 kHz~32 kbps~14 MB
無損48 kHz~256 kbps~110 MB

預設的「壓縮」是多數人踩進去的坑。32 kbps 的音檔用耳朵聽沒問題,但丟掉了語音辨識仰賴的高頻細節。重要訪談前切到「無損」每小時多耗 100 MB 空間,可是任何辨識引擎(包括 Apple 自家)的準確率都會提高 3–5 個百分點。

檔案命名規則照這個順序跑:(1)有開「定位服務」就用 GPS 解析出的地點命名,例如 台北辦公室;(2)否則沿用上一段錄音的名字加序號;(3)兜底叫 新的錄音。結果是用一段時間後整個庫裡全是 新的錄音 47 之類的檔名,誰都認不出。

iOS 18+ 內建語音轉文字能做什麼、不能做什麼

iOS 18 上線的「逐字稿」頁面到 iOS 26 稍微多了一點功能,但限制還是很清楚。

語言。 iOS 26 的本機模型大約支援 13 種:英語(美/英/澳/加/印/新加坡/南非)、西班牙語(美/墨/西)、國語(中國大陸/台灣)、粵語、法語(法/加)、德語(德/瑞/奧)、義大利語、日語、韓語、葡萄牙語(巴/葡)、阿拉伯語(沙烏地)、俄語、土耳其語。其他語言——越南語、泰語、印地語、希伯來語、波蘭語、荷蘭語、北歐諸語、所有非洲語言、越南語以外的東南亞語言——都拿不到逐字稿,「逐字稿」頁籤根本不會出現。

硬體。 需要 A15 神經網路引擎以上的裝置:iPhone 13 系列以後、iPad mini 6 / iPad Air 5 / iPad Pro 2021 以後、所有 Apple Silicon Mac(M1 起)。更舊的裝置可以聽錄音,但永遠看不到逐字稿頁籤,即使語言是支援的。

匯出。 逐字稿可以一段一段選起來複製,但完全沒有「匯出逐字稿」這個動作。不能存成 .txt.docx.srt.vtt,也沒辦法只分享逐字稿不分享音訊。在 iPhone 上拿到全文唯一的辦法是長按 → 全選 → 複製,而且要一頁一頁滾動處理。

準確率。 Apple 本機模型比任何雲端服務都快(邊錄邊轉,幾乎即時),可是比最強雲端引擎差了一截。錄音室乾淨音檔的美式英語,本機模型大約 88–92% 字準;吵雜咖啡店裡的 iPhone 麥克風音檔則掉到 70 多。Atter AI 在 90+ 種語言乾淨音檔上的準確率是 98.7%——這個差距對可搜尋的檔案庫和法律等級逐字稿特別致命。

標點與說話人辨識。 本機逐字稿有基本標點,但完全不做說話人分軌。每一行都歸到裝置本身。兩個人的對談讀起來就是一段不分人的獨白。

方法一:在 iPhone 上拿到內建逐字稿(iOS 18+)

支援的裝置 + 支援的語言:

  1. 打開語音備忘錄,點一段錄音。
  2. 點錄音卡片右上角的**≡**圖示開啟逐字稿頁籤。圖示沒出現,代表語言或硬體不支援。
  3. 逐字稿以可捲動文字呈現,跟播放同步。點任何一個字都可以跳到對應時間戳。
  4. 複製:長按 → 全選拷貝。貼到備忘錄、郵件或任何文字 App。

iOS 24+ 的「逐字稿」頁籤裡也是 Apple Intelligence 摘要功能的入口(開啟後可用)。摘要很短(3–6 點),完全在本機產生,支援的語言比逐字稿還少——iOS 26 起包含美式英語、國語以及少數幾種。

方法二:用 Atter AI 拿到完整逐字稿

Apple 內建做不到的——不支援的語言、舊硬體、檔案匯出、說話人標籤、超過 6 點的摘要——都用同一條流程,不挑 iPhone 型號:

  1. 在語音備忘錄點開錄音 → 點更多...)→ 分享 → 選 Atter AI(裝了就會出現)或選**儲存到「檔案」**手動上傳。
  2. 用 Atter AI 的 iPhone App 上傳的話,點 匯入 → 語音備忘錄,App 會直接從語音備忘錄資料庫讀取錄音,不必中轉檔案。
  3. 30 分鐘錄音通常 60–90 秒出逐字稿。匯出支援 PDF、DOCX、TXT、SRT、VTT、JSON 等格式。
  4. Atter AI 提供 3 天免費試用,整條流程都包含。付費方案起價每週 6.99 美元、每年 49.99 美元、終身 129.99 美元,沒有時長或檔案數上限。

長訪談要同時拿逐字稿和摘要時,Atter AI 摘要長度可調(一段話到完整會議紀錄),不像 Apple Intelligence 鎖死 6 點。同一條轉錄管線也驅動了 音訊轉文字指南Podcast 逐字稿指南——引擎一樣,只是輸入來源不同。

方法三:把 .m4a 抓到電腦

不想再裝一個 App 在手機上,那就先把原始檔案搞到電腦:

  • AirDrop 到旁邊的 Mac。語音備忘錄 → 錄音 → 分享 → AirDrop。.m4a 進到 ~/下載。最快、不需要網路。
  • iCloud 同步。 打開 設定 → [你的名字] → iCloud → 語音備忘錄。錄音會出現在所有登入同一 Apple ID 的 Mac 和 iPad。在 Mac App 把錄音從側邊欄拖到 Finder 視窗就拿到 .m4a
  • 「檔案」App。 iPhone 上語音備忘錄 → 分享 → 儲存到「檔案」→ 選我的 iPhone 或任一 iCloud 資料夾。錄音之後對其他 App 可見,對 Mac 透過 iCloud 雲碟可見。
  • 郵件或訊息。 Mail 的 25 MB 附件上限大約能塞下 100 分鐘內的壓縮錄音;無損錄音 12 分鐘左右就到頂。iMessage 上限 100 MB。

.m4a 到電腦後,丟進 Atter AI 網頁上傳器或用 macOS App,結果一樣:同一份雲端等級的逐字稿。

方法四:Apple Watch 錄音

Apple Watch 上的語音備忘錄複雜功能可以直接用手錶麥克風錄音,螢幕關著也能錄——走廊邊聊或臨時筆記的時候很方便。手錶錄製採 16 kHz 單聲道(比 iPhone 的 32 / 48 kHz 低一階),錄完 1–2 分鐘內透過藍牙或 Wi-Fi 同步到配對的 iPhone。

16 kHz 的手錶錄音對人耳夠用,對辨識準確率傷害卻很明顯。重要場合請以 iPhone 為主或外接麥克風。Apple Watch 連續錄音的電池上限大約 100 分鐘,超過一小時的場合預設就應該換手機。

語音備忘錄逐字稿常見地雷

iCloud 同步可能延遲。 飛航模式下錄的音檔要等回到網路才同步。同步前 AirDrop 出去能拿到檔案,但 Mac 上的本機逐字稿頁籤可能一直卡在「逐字稿產生中…」,因為 Mac 在跑的是另一份本機模型,處理的是和 iPhone 不同的副本。

錄音中接電話會被截斷。 來電時語音備忘錄會暫停,掛掉後恢復——可是要 iOS 26 起才會把錄音拆成兩段。iOS 18 及更早版本的暫停沒有任何提示,最後的檔案丟掉通話那段時長,沒有任何標記。

降噪是破壞性的。 錄音編輯器裡的增強錄音開關用本機模型去背景雜音。處理過的檔案直接覆蓋原檔,除非你先點重製。從轉錄角度看,增強版通常更好;從存檔或法律角度看,兩個版本都要留。

2 GB 上限。 單段錄音不能超過 2 GB。無損品質約 18 小時封頂;壓縮品質約 138 小時。撞到上限就靜悄悄停下,檔案在觸發那一刻關閉。

Apple Intelligence 摘要綁語言白名單。 錄音是 Apple Intelligence 不支援的語言(越南語、印地語、泰語等)時,「摘要」按鈕根本不顯示,即使裝置能在其他語言上跑 Apple Intelligence。Atter AI 的摘要在 90+ 種語言都能跑,沒有白名單。

Apple 內建 vs Atter AI

能力iOS 語音備忘錄內建Atter AI
乾淨 iPhone 音檔準確率~88–92%98.7%
支援語言數13(iOS 26)90+
硬體需求A15+ 神經引擎任何有瀏覽器的裝置
說話人標籤 / 分軌完整支援,可重新命名
匯出格式無(只能複製貼上)PDF, DOCX, TXT, SRT, VTT, JSON
摘要3–6 點固定長度可調,結構化會議紀錄
跨錄音搜尋一次一段全文索引整個資料庫
費用免費,需要較新的 iPhone每週 6.99 美元 · 每年 49.99 美元 · 終身 129.99 美元 · 3 天免費試用

會議錄音場景下——主持人忘了在 Zoom 或 Teams 開錄影,臨時只剩語音備忘錄能救——把這篇和 AI 會議逐字稿指南 一起讀,能拿到說話人分軌和摘要的實務做法。

iPhone 語音備忘錄逐字稿 FAQ

為什麼我的語音備忘錄看不到「逐字稿」頁籤?

三種原因。(1)你的 iPhone 比 iPhone 13 還舊——本機語音模型需要 A15 神經引擎以上。(2)錄音語言不在 Apple 支援的 13 種白名單裡。(3)你跑在 iOS 17 或更早,逐字稿頁籤還沒推出。任一條都會讓圖示完全隱藏。

可以把語音備忘錄的逐字稿匯出成文字檔嗎?

原生不行。iOS 26 沒有「匯出逐字稿」這個動作。可以全選複製貼到備忘錄或郵件,但要拿到 .txt.docx.srt.vtt 檔案,必須把音檔交給像 Atter AI 這樣的轉錄服務。

iCloud 同步的是逐字稿還是只有音檔?

只有音檔。逐字稿在每台裝置第一次打開頁籤時依需重新產生。在不支援本機模型的舊 Mac 或 iPad 上,音檔正常同步但逐字稿永遠不會出現。

2026 年語音備忘錄到底支援哪些語言?

iOS 26 約 13 種:英語(多地區)、西班牙語(美/墨/西)、國語(中國大陸/台灣)、粵語、法語(法/加)、德語、義大利語、日語、韓語、葡萄牙語(巴/葡)、阿拉伯語(沙烏地)、俄語、土耳其語。Atter AI 涵蓋 90+ 種,包括越南語、泰語、印地語、希伯來語、波蘭語、荷蘭語、瑞典語、挪威語、芬蘭語,以及大部分非洲與東南亞語言。

iPhone 語音備忘錄逐字稿準確率夠新聞或法律用嗎?

重點筆記等級夠——Apple 本機模型乾淨音檔下 88–92%。逐字稿、庭審紀錄、任何不能錯字的場合,不夠。一小時訪談裡 5–10 個百分點的差距會累積成 60 到 120 個錯字,全部得人工抓出來改。

Atter AI 轉語音備忘錄需要連網嗎?

需要。Atter AI 引擎跑在雲端,正是這一點讓它能在 90+ 種語言維持更高的準確率上限,而不必受 iPhone 硬體限制。檔案全程加密傳輸,轉錄完成後暫存自動清除。

有沒有辦法不透過語音備忘錄直接錄成可轉錄的格式?

Atter AI iPhone App 邊錄邊轉,錄音同時就在產出逐字稿。原始 .m4a 保留在逐字稿旁邊作為兄弟檔。這條路徑完全跳過匯出步驟,90+ 種語言都支援。

Atter AI App 可以讀取我原本的語音備忘錄資料庫嗎?

可以。第一次在 iOS 設定授權 Atter AI 存取語音備忘錄後,App 會依日期列出整個資料庫的錄音。選一段就會直接匯入底層 .m4a,不必走分享選單或先存到「檔案」。