语音备忘录可能是全球使用最广的录音机——预装在 2026 年大约 22 亿部活跃 iPhone 上——但绝大部分历史里它只能给你一个 .m4a 文件,别的什么都做不了。2024 年 9 月 iOS 18 终于内置了转录文稿视图,可惜上线时就带了几条硬性天花板:只支持 13 种语言、只能本地处理且绑定特定 iPhone 硬件、转录文本本身无法导出。两年后的 iOS 26 把这几条天花板抬高了一点,但还是真实存在的。
这篇指南讲清楚 2026 年 Apple 自带录音转文字到底能做什么、语音备忘录在 iPhone / iPad / Mac / Apple Watch 四个平台分别把文件存在哪里,以及如何用 AI 转录工具把任意一段语音备忘录文件转成 90+ 语言、98.7% 准确率的完整可编辑文稿——不论你的 iOS 版本多老。
iPhone 语音备忘录到底生成的是什么
每段录音都是 .m4a 文件,AAC 压缩,单声道,质量在 设置 → 语音备忘录 → 音频质量 里二选一:
| 设置 | 采样率 | 比特率 | 60 分钟文件大小 |
|---|---|---|---|
| 压缩(默认) | 32 kHz | ~32 kbps | ~14 MB |
| 无损 | 48 kHz | ~256 kbps | ~110 MB |
默认的「压缩」是大部分人踩进去的坑。32 kbps 的音频用耳朵听没问题,但丢掉了语音识别赖以判断的高频细节。重要采访前切换到「无损」每小时多占 100 MB 存储,但对任何识别引擎(包括 Apple 自家)都能把准确率往上抬 3–5 个百分点。
文件命名规则按这三条顺序执行:(1)打开了「定位服务」就用 GPS 定位到的地点命名,例如 上海、公司、家;(2)否则沿用上一条录音的名字加序号;(3)兜底用 新录音。结果就是用久了的语音备忘录库里全是叫 新录音 47 的文件,谁都认不出来。
iOS 18+ 自带录音转文字能做什么、不能做什么
iOS 18 上线的「转录文稿」视图在 iOS 26 里稍微扩了一点,但限制仍然清晰。
语言。 iOS 26 的本地模型大约支持 13 种语言:英语(美/英/澳/加/印/新加坡/南非)、西班牙语(美/墨/西)、普通话(大陆/台湾)、粤语、法语(法/加)、德语(德/瑞/奥)、意大利语、日语、韩语、葡萄牙语(巴/葡)、阿拉伯语(沙特)、俄语、土耳其语。其他语言——越南语、泰语、印地语、希伯来语、波兰语、荷兰语、北欧诸语、所有非洲语言、越南语以外的所有东南亚语言——都不会出现转录文稿。「转录」标签干脆就不显示。
硬件。 转录需要 A15 神经网络引擎或更新的设备:iPhone 13 系列及以后、iPad mini 6 / iPad Air 5 / iPad Pro 2021 及以后、所有 Apple Silicon Mac(M1 起)。更老的设备能放录音,但永远看不到转录视图,哪怕语言支持。
导出。 文稿可以一段一段选中复制,但没有任何「导出文稿」按钮。无法保存为 .txt、.docx、.srt、.vtt。也没法单独分享文稿而不带音频。在 iPhone 上拿到完整文本的唯一办法是长按 → 全选 → 复制 → 粘贴,而且要一屏一屏滚着复制。
准确率。 Apple 本地模型比任何云服务都快(边录边转,几乎实时),但比最好的云端引擎差一大截。在纯净的录音棚音频上,本地模型大约能打到 88–92% 的字准;在嘈杂咖啡店里的 iPhone 麦克风音频则跌到 70 多。Atter AI 在 90+ 种语言上的干净音频准确率是 98.7%——这个差距对可搜索的档案库和法律级文稿尤其关键。
标点和说话人分轨。 本地文稿带基本标点,但完全不做说话人分离。每一行都归到设备本身。两个人的采访读起来就是一段不分人的独白。
方法一:在 iPhone 上拿到自带转录文稿(iOS 18+)
支持的设备 + 支持的语言:
- 打开语音备忘录,点开一段录音。
- 点录音卡片右上角的**≡**图标进入转录视图。图标不见,说明语言或硬件不支持。
- 文稿以可滚动文本呈现,与播放同步。点任何一个词都能跳到对应时间戳。
- 复制:长按 → 全选 → 拷贝。粘贴到备忘录、邮件或任何文本 App。
iOS 24+ 在转录视图里嵌入了「使用 Apple Intelligence 总结」功能(启用后可用)。摘要很短(3–6 条要点),完全在本地生成,支持的语言比转录还要再少一档——iOS 26 起包括美式英语、普通话和少数几种。
方法二:用 Atter AI 拿到完整文稿
Apple 自带文稿做不了的事——不支持的语言、老硬件、文件导出、说话人标签、超过六条要点的摘要——都用同一条流程解决,不挑 iPhone 型号:
- 在语音备忘录里点开录音 → 点更多(
...)→ 分享 → 选 Atter AI(已安装就直接出现),或者选**存储到「文件」**手动上传。 - 如果用 Atter AI 的 iPhone App 上传,点 导入 → 语音备忘录,App 直接读取语音备忘录库里的录音,不需要中转。
- 30 分钟录音通常 60–90 秒就能出文稿。输出支持 PDF、DOCX、TXT、SRT、VTT、JSON 等格式。
- Atter AI 提供 3 天免费试用,覆盖这条完整流程。付费版起步价 6.99 美元/周、49.99 美元/年、129.99 美元终身,没有时长或文件数限制。
需要同时拿文稿和摘要的长采访,Atter AI 摘要长度可调(一段话到完整会议纪要),不像 Apple Intelligence 锁死 6 条。同一条转录管线也驱动了 音频转文字指南 和 播客转录指南——引擎是同一个,只是输入源不同。
方法三:把 .m4a 文件导出到电脑
不想往手机上装别的 App,那就先把原始文件搞到电脑:
- AirDrop 到附近的 Mac。语音备忘录 → 录音 → 分享 → AirDrop。
.m4a落到~/下载。最快、无需联网。 - iCloud 同步。 打开 设置 → [你的名字] → iCloud → 语音备忘录。录音会出现在所有登录同一 Apple ID 的 Mac 和 iPad 上。在 Mac App 里把录音从侧边栏拖到 Finder 窗口就能拿到
.m4a。 - 「文件」App。 iPhone 上语音备忘录 → 分享 → 存储到「文件」→ 选我的 iPhone 或任何 iCloud 文件夹。录音随后对其他 App 可见,对 Mac 通过 iCloud 云盘可见。
- 邮件或信息。 邮件 25 MB 附件上限大约能装下 100 分钟以内的压缩录音;无损录音 12 分钟封顶。iMessage 上限 100 MB。
.m4a 到电脑之后,把它拖进 Atter AI 网页上传器或者用 macOS App 上传,结果一样:同一份云端级别的文稿。
方法四:Apple Watch 录音
Apple Watch 上的语音备忘录复杂功能(Complication)可以直接用手表麦克风录音,屏幕熄屏也能录——走廊聊几句或者临时记录的时候很方便。手表用 16 kHz 单声道录(比 iPhone 的 32 / 48 kHz 低一档),录完 1–2 分钟内会通过蓝牙或 Wi-Fi 同步到配对的 iPhone。
16 kHz 的手表录音对人耳够用,对识别准确率却有明显伤害。重要场合优先 iPhone 或外接麦克。Apple Watch 连续录音的电池上限大约 100 分钟,这也是为什么超过一小时的录音默认就该用手机。
语音备忘录转录的坑
iCloud 同步可能滞后。 飞行模式下录的音频要等回到网络才同步。同步前 AirDrop 出去能拿到文件,但你 Mac 上的本地转录视图可能一直卡在「正在生成转录…」,因为 Mac 在跑的是另一份本地模型,处理的是和 iPhone 不同的副本。
录音中接电话会被截断。 接来电时语音备忘录会暂停,挂掉后恢复——但只有 iOS 26 起才会把这段拆成两个文件。iOS 18 及更早版本的暂停是静默的,最后的文件丢掉了通话期间的时长,没有任何标记。
降噪是破坏性的。 录音编辑器里的增强录音开关用本地模型去除背景噪声。处理后的文件直接覆盖原始版本,除非你先点复制。从转录角度看,增强版通常更好;从存档或法律角度看,两个版本都要留。
2 GB 上限。 单条录音不能超过 2 GB。无损质量大约 18 小时封顶;压缩质量大约 138 小时。撞到上限就静悄悄停下,文件在触发上限的那一刻被关闭。
Apple Intelligence 摘要服从语言白名单。 录音是 Apple Intelligence 不支持的语言(越南语、印地语、泰语等)时,「总结」按钮根本不显示,哪怕设备能在其他语言上跑 Apple Intelligence。Atter AI 的摘要在 90+ 语言上都能跑,没有白名单。
Apple 自带 vs Atter AI
| 能力 | iOS 语音备忘录自带 | Atter AI |
|---|---|---|
| 干净 iPhone 音频准确率 | ~88–92% | 98.7% |
| 支持语言数 | 13(iOS 26) | 90+ |
| 硬件要求 | A15+ 神经引擎 | 任意带浏览器的设备 |
| 说话人标签 / 分轨 | 无 | 全支持,可重命名 |
| 导出格式 | 无(只能复制粘贴) | PDF, DOCX, TXT, SRT, VTT, JSON |
| 摘要 | 3–6 条,固定 | 长度可调,结构化会议纪要 |
| 跨录音搜索 | 一次一条 | 全文索引库 |
| 价格 | 免费,需要较新的 iPhone | 6.99 美元/周 · 49.99 美元/年 · 129.99 美元终身 · 3 天免费试用 |
会议录音场景下——主持人忘了在 Zoom 或 Teams 里点录制,临时只剩语音备忘录兜底——把这篇和 AI 会议录音转文字指南 一起读,能拿到说话人分轨和摘要的最佳实践。
iPhone 语音备忘录录音转文字 FAQ
为什么我的语音备忘录看不到「转录」标签?
三种可能。(1)你的 iPhone 比 iPhone 13 还老——本地语音模型需要 A15 神经引擎或更新。(2)录音语言不在 Apple 支持的 13 种白名单里。(3)你跑在 iOS 17 或更早,转录视图还没上线。任意一条都会让图标整个隐藏。
能把语音备忘录的文稿导出成文本文件吗?
原生不行。iOS 26 里 Apple 没提供「导出文稿」操作。可以全选复制粘贴到备忘录或邮件,但要拿到 .txt、.docx、.srt、.vtt 文件,只能把音频丢给像 Atter AI 这样的转录服务。
iCloud 同步的是文稿还是只有音频?
只有音频。文稿在每台设备上第一次打开转录视图时按需重新生成。在不支持本地模型的老 Mac 或 iPad 上,音频正常同步但文稿永远不出现。
2026 年语音备忘录支持哪些语言转录?
iOS 26 大约 13 种:英语(多地区)、西班牙语(美/墨/西)、普通话(大陆/台湾)、粤语、法语(法/加)、德语、意大利语、日语、韩语、葡萄牙语(巴/葡)、阿拉伯语(沙特)、俄语、土耳其语。Atter AI 覆盖 90+ 种,包括越南语、泰语、印地语、希伯来语、波兰语、荷兰语、瑞典语、挪威语、芬兰语,以及大部分非洲和东南亚语言。
iPhone 语音备忘录的转录准确率够新闻或法律用吗?
要点级的笔记,够——Apple 本地模型在干净音频上 88–92%。逐字稿、庭审记录、任何不能错字的场合,不够。一小时采访里 5–10 个百分点的差距会累积成 60 到 120 个识别错误,你得自己一个个找出来改。
Atter AI 转录语音备忘录需要联网吗?
需要。Atter AI 引擎跑在云端,正是这一点让它能在 90+ 种语言上撑住更高的准确率上限,而不必依赖 iPhone 的硬件。文件传输全程加密,转录完成后临时存储自动清除。
有没有办法不通过语音备忘录直接录成可转录格式?
Atter AI iPhone App 边录边转,录音的同时就在出文稿。原始 .m4a 作为兄弟文件保留在文稿旁边。这条路径完全绕开了导出步骤,并且 90+ 种语言都支持。
Atter AI App 能直接读取我已有的语音备忘录库吗?
可以。第一次在 iOS 设置里给 Atter AI 授权访问语音备忘录后,App 会按日期列出整个库里的录音。选中一条会直接导入底层 .m4a,不必走分享菜单或先存到「文件」里。