AI 转录

Zoom 会议录音转文字:真正省时间的 AI 工作流

Zoom 云录制和实时通话一键变成可搜索文字稿——比对 Zoom 自带转录与 Atter AI 的说话人识别、摘要和导出。

Zoom 是跨组织通话发生频率最高的平台,而且它的录制逻辑自成一套。一场 Zoom 会议结束后,会留下一组非常特定的文件——视频、纯音频轨道、聊天记录、字幕文件,以及(如果你开启了的话)一份独立的音频转录——分散在主持人电脑本地或 Zoom 云端。搞清楚每个文件在哪、Zoom 保留多久、哪个文件 AI 工具真正能读,是「一键得到文字稿」和「翻找一下午」之间的区别。

本文专门针对 Zoom 的特殊性来写:本地录制与云端录制的路径差异、四类文件输出、「音频转录」开关、Zoom IQ 会议摘要,以及 30 天云端保留窗口——最终告诉你如何以 98.7% 的准确率从中拿到完整文字稿。

Zoom 会议结束后实际产生什么文件

每次 Zoom 录制,无论存在本地还是云端,都会生成一组文件,而非单个视频。了解每个文件的用途很重要,因为并非所有文件都同样适合用来转录。

  • .mp4 — 完整视频文件(宫格或主讲人视图)。
  • .m4a — 纯音频轨道。这是你应该上传给转录引擎的文件:体积更小、上传更快,音频已与屏幕共享内容隔离。
  • .txt — 聊天记录,Zoom 命名为 chat.txt。常被忽视,但在核对会议口头决策与聊天框里分享的链接和备注时很有用。
  • .vtt — WebVTT 字幕文件,由 Zoom 实时字幕功能生成,前提是会议前开启了「保存字幕」。
  • audio_transcript.vtt(仅云端)— 如果云端录制的音频转录开关已打开,Zoom 在会议后生成的独立转录文件。
  • .m3u — 指向本地录制片段的播放列表文件。仅供展示用,可忽略。

本地录制时,Zoom 默认将所有文件写入 macOS 和 Windows 上的 Documents/Zoom/<日期和主题>/。云端录制时,同一组文件存放在 zoom.us/recording 的 Zoom 网页端录制板块下。

Zoom 本地录制 vs 云端录制:点击录制前先想清楚

Zoom 录音转文字流程中最关键的一个设置是录制文件存放位置,因为它会改变所有下游选项。

Zoom 本地录制

所有 Zoom 套餐(包括免费版)均可使用。只有主持人(或主持人授权的参会者)才能开始本地录制,且只能在桌面端操作——Zoom 移动端 App 无法本地录制。MP4 和 M4A 文件仅存在于该主持人的机器上。本地录制没有 Zoom 生成的转录;音频转录功能仅限云端录制。

Zoom 云端录制

需要付费套餐(Pro、Business、Education 或 Enterprise)以及持有 license 的主持人账号。文件存入 Zoom 云端,可在 zoom.us/recording 访问。云端录制是解锁会后音频转录.vtt)、在支持的套餐上使用 Zoom IQ 会议摘要,以及让 AI 集成工具自动拉取录制内容的前提。

Zoom 30 天云端保留默认值

这是每位 Zoom 管理员必踩的坑:Zoom 云端录制默认在上传之日起 30 天后自动删除。账户拥有者可以在**账户管理 → 账户设置 → 录制 → 自动删除云端录制(天数)**中调整,大多数付费套餐最长可设 120 天,Business 及以上套餐可关闭自动删除。如果打算转录历史 Zoom 录制,先确认这个设置,别以为文件还在。

方法一:Zoom 内置音频转录

Zoom 可以在会议结束后自动生成 .vtt.txt 转录文件——这与实时字幕和 Zoom IQ 会议摘要都是独立的功能。默认对大多数账户关闭。

  1. 以账户拥有者或管理员身份登录 zoom.us。
  2. 进入账户管理 → 账户设置 → 录制
  3. 滚动到云端录制,确认已启用。
  4. 展开其选项,开启创建音频转录
  5. 如果希望转录内容在 Zoom 回放时叠加显示,可同时开启在录制视频上显示字幕,这样 .vtt 会在 Zoom 内播放时嵌入画面。

下次云端录制会议处理完成后——短会通常在会议时长的两倍以内,长会有时需要几个小时——转录文件会出现在 Zoom 网页端的录制旁边。可下载为 .vtt(带时间戳、逐行)或 .txt(连续正文带说话人标签)。

这份转录用来快速浏览还行,但不适合作为系统记录。在专业术语、带口音的发言者和多人同时说话的情况下,准确率明显低于 Atter AI 在干净音频上达到的 98.7%,且没有内置的跨会议搜索。

方法二:Zoom IQ 会议摘要

Zoom IQ 会议摘要是 Zoom 自己基于大语言模型的会后摘要,适用于启用了 Zoom AI Companion 的套餐。主持人在会议控制面板的 AI Companion 中按会议启用(或设为默认)。它输出摘要、下一步行动和议题列表——但不会以可搜索、可编辑的形式提供底层转录文字用于归档,且语言覆盖范围也比 Zoom 字幕窄。

把它当作 Zoom 内部的快速回顾工具,而非一套导出流程。

方法三:将 Atter AI 连接到 Zoom 云端录制

对于希望每场 Zoom 会议结束后无需主持人额外操作就能获得一致准确率的团队,最简洁的方案是 Zoom 云端录制加 Atter AI Zoom 集成。

  1. 在 Atter AI 中打开集成 → Zoom,点击授权
  2. 授权 Zoom OAuth 权限范围 recording:readmeeting:read。Business 和 Enterprise 套餐的账户拥有者可能需要先在 Zoom App Marketplace 中预批准 Atter AI 应用,组织内的用户才能安装。
  3. 在 Zoom 中,将默认录制模式设置为录制到云端,未来会议就会自动走集成流程。

云端录制处理完成后,Atter AI 拉取 .m4a 音频(而非更大的 .mp4),用针对 Zoom 音频特性调优的说话人分离模型进行转录,并将结果发布到你的仪表盘。Atter AI 在这个流程中对干净音频达到 98.7% 准确率,在带口音的发言和技术术语方面明显优于内置转录。

该集成默认忽略聊天 .txt,但你可以选择将其附加到转录结果,这样聊天中分享的链接就不会丢失。

方法四:Atter AI 记录机器人加入 Zoom 会议

如果无法使用云端录制——免费 Zoom 账号、IT 策略限制,或会议由他人主持——可以邀请 Atter AI 作为参会者加入。

  1. 将 Zoom 会议链接(或带密码的完整加入 URL)粘贴到 Atter AI 的添加会议字段,或连接日历让它自动加入。
  2. 机器人以「Atter AI Notetaker」身份加入。视主持人设置,可能先进入等候室,主持人点击准入后进入会议。
  3. 机器人实时捕捉会议音频混音,通话结束后几秒内即可得到转录结果。

两个 Zoom 特定行为需要了解:

  • 如果主持人设置了仅主持人可录制,机器人仍然可以捕捉音频,因为它以普通参会者身份加入——它不需要 Zoom 的录制权限。但主持人可以随时将其从参会者列表移除,这将立即停止捕捉。
  • 如果会议使用了端对端加密(Zoom 的 E2EE 模式,而非标准「加密」会议),任何第三方应用——包括任何记录机器人——都无法参会,因为 E2EE 阻断了服务器端的音频路由。此时只能回到事后上传本地录制的方案。

方法五:上传本地 Zoom 录制文件

最低摩擦的方案,适合归档通话或免费套餐用户:

  1. 打开 Documents/Zoom/,找到会议文件夹。
  2. audio_only.m4a 上传到 Atter AI(不要用 .mp4——内容相同,但体积只有十分之一)。
  3. 选择会议语言,点击转录。

60 分钟的 .m4a 通常在 2 到 4 分钟内完成转录。

避免这些 Zoom 特定的坑

以下是那些会悄悄浪费大量时间的 Zoom 专属陷阱。

30 天自动删除陷阱。 如上所述——除非管理员延长了保留期,否则默认假设旧的云端录制已经消失。可以查看 zoom.us/recording → 回收站,30 天软删除宽限期内的文件还可以恢复。

主持人与参会者的录制权限不等于转录权限。 给参会者允许录制权限让他们可以本地录制,但只有主持人的云端录制才会产生会后音频转录。如果你把录制任务交给队友,确保他们在自己的付费账号下录制到云端,否则最终只有 MP4 而没有转录文件。

账户级 → 组级 → 用户级设置按此顺序生效。 如果「创建音频转录」在账户级被锁定关闭,任何用户都无法打开。管理员排查缺失转录问题时,应先检查账户管理 → 账户设置 → 录制,再检查用户管理 → 组管理中是否有组级覆盖。

「实时字幕」和「音频转录」是两个不同的功能。 「保存字幕」生成的是会议期间实时写入的 .vtt。「创建音频转录」生成的是云端录制完成后另行生成的、通常准确率更高的会后转录。开启其中一个不会自动开启另一个。

audio_transcript.vtt 使用与录制相同的云端音频生成,所以如果云端录制本身被禁用,即使开关已打开也不会产生转录。

Zoom 原生功能不转录分组讨论间。 每个分组讨论间被视为独立的音频上下文,Zoom 的音频转录只覆盖主会议室。记录机器人需要在每个分组讨论间开启时手动分配进去才能捕捉。

Zoom 原生 vs Atter AI

能力Zoom 音频转录Atter AI
干净音频准确率约 85–90%98.7%
支持本地录制
支持 Zoom 免费套餐是(上传或机器人)
跨会议搜索
外部访客说话人分离有限完整
导出格式.vtt.txtPDF、DOCX、TXT、SRT、VTT、JSON
语言覆盖有限40+ 种
30 天后是否保留仅管理员延长后保留是,按你自己的保留策略

平台横向对比:与 Microsoft Teams 不同,Teams 录制存放在主持人的 OneDrive 或频道的 SharePoint 并继承组织保留策略,Zoom 的 30 天默认值是在 Zoom 账户层面设置的,对你更广泛的 Microsoft 365 治理完全不可见——详见我们的 Microsoft Teams 录音转文字指南。与 Google Meet 不同,Meet 录制需要 Workspace Business Standard 或更高套餐,Zoom 免费用户无需升级即可本地录制,这就是为什么上面方法五的本地上传流程在 Google Meet 上没有真正对应的方案。而 Webex 至今仍有两种录制容器(MP4 和旧版 ARF),Zoom 多年前就统一到了 MP4 加独立 M4A 音频轨道——实际效果是任何 Zoom 录制文件都可以直接上传到任何转录工具,而 Webex 的 ARF 文件还需要一个转换步骤(详见我们的 Webex 指南)。

Zoom 专项常见问题

如何延长 Zoom 云端录制的 30 天保留期?

作为账户拥有者或管理员,进入账户管理 → 账户设置 → 录制 → 云端录制 → 自动删除云端录制(天数)。大多数付费套餐最长可延至 120 天,Business 及以上套餐可关闭自动删除。该设置从更改之日起生效,不追溯——已超过阈值的录制已不可恢复。

为什么 Zoom 没有为我的云端录制创建音频转录?

三个最常见原因,按概率排序:(1) 录制设置中创建音频转录未开启;(2) 主持人录制到了本地而非云端;(3) 账户级设置被锁定关闭,覆盖了用户层面的开关。从这三个层面逐一排查。

Atter AI 记录机器人能加入有等候室的 Zoom 会议吗?

可以。它以「Atter AI Notetaker」的名称出现在等候室,主持人像接纳其他访客一样将其准入。如果会议开启了端对端加密(Zoom 的 E2EE 模式),任何记录机器人都无法参会,这是设计如此。

Zoom 本地录制保存在哪里,可以更改路径吗?

默认是 macOS 和 Windows 上的 Documents/Zoom/。可以在 Zoom 桌面客户端的设置 → 录制 → 将我的录制存储到中更改路径。

Zoom 会转录分组讨论间吗?

Zoom 原生音频转录只覆盖主会议室,不包括分组讨论间。如果需要分组讨论的转录,在开启分组讨论间时为每个讨论间分配一个 Atter AI 记录机器人(或一名本地录制的参会者)。

Zoom 的「保存字幕」和「创建音频转录」有什么区别?

保存字幕在会议期间存储实时字幕流,生成 .vtt 文件。创建音频转录在云端录制处理完成后运行,从完整录制音频中生成独立的、通常准确率更高的转录文件。两者是独立的设置。

我能转录别人主持的 Zoom 会议吗?

可以,前提是对方把录制文件分享给你。Atter AI 的上传流程接受他们发来的 .m4a.mp4;无需你的账号与他们的 Zoom 账号关联。

Zoom IQ 会议摘要能替代转录文字稿吗?

不能。Zoom IQ 生成摘要和下一步行动列表,而非完整的可搜索文字稿。在 Zoom 内快速回顾会议时用它;需要归档、搜索或导出底层文字时,使用 Atter AI 或 Zoom 的音频转录。