快速解答
要自动录音转文字,只需在你选择的平台上录制会议,将文件上传到 Atter AI,启用说话人标注和语言检测,让 AI 在几分钟内生成逐字稿和摘要。每次会议整个流程只需你大约 5 分钟。
这篇指南详细介绍每个步骤,包括各平台的录音操作方法、Atter AI 的配置、说话人设置、输出内容审核,以及如何将结果分享给团队。
为什么要搭建自动转录工作流?
会议中手动记录有三个核心问题:记录时无法全程专注参与;重要细节依然会被遗漏;不同人的记录方式不一致。
自动工作流能解决这三个问题。一旦配置好,每次都能以几乎零人工干预的方式产出同等质量的输出。
自动转录工作流能给你带来什么:
- 每次会议的完整逐字稿
- 带说话人标注的分段,清楚知道谁说了什么
- AI 生成的摘要(通常 3–5 句话)
- 自动提取的待办事项及负责人
- 单独列出的关键决策
- 所有历史会议的可搜索档案库
- 随时可导出的 Word/PDF 文件供外部分享
Atter AI 在干净音频上的准确率达到 98.7%,支持 90+ 种语言,且没有时长限制——这意味着 3 小时的董事会议和 15 分钟的站会可以用同样的方式处理。
开始前需要准备什么
在搭建自动转录流程之前,准备好以下几样东西:
- 录音方式 — 视频会议平台的内置录制功能、专用录音应用,或面对面会议用的麦克风
- Atter AI 账号 — 在 atter-ai.com 开始 3 天免费试用
- 固定的文件存放位置 — 录音文件自动保存的文件夹,这样你每次都知道去哪里找
- 分享目标 — Slack、飞书、邮件或你的团队用于查看会议记录的任何工具
第一步:在平台上录制会议
不同平台有不同的录制选项。以下是最常用平台的录制方法:
Zoom
- 在通话过程中点击底部工具栏的「录制」按钮
- 选择「录制到本机」保存本地文件,或「录制到云端」存到云端
- 会议结束后文件导出为 MP4(视频)或 M4A(纯音频)
- 云端录制内容同时出现在 Zoom 网页后台
Microsoft Teams
- 在通话中点击「更多操作」(三个点图标)
- 选择「开始录制」
- Teams 自动将录制内容保存到 SharePoint 或 OneDrive
- 下载 MP4 文件后上传到 Atter AI
Google Meet
- 点击「活动」→「录制」→「开始录制」(需要 Google Workspace Business 版本或更高)
- 录制内容以 MP4 格式保存到会议组织者的 Google Drive
- 下载后上传到 Atter AI,或如果工具支持 URL 导入,直接用 Google Drive 链接
面对面会议
- 在 iPhone 或 Android 上使用 Atter AI 移动端应用直接录音
- 或使用专用录音笔导出 MP3 或 WAV 格式
- Apple Watch 用户可以从表盘直接启动 Atter AI 录制
电话通话
- 使用手机内置通话录音功能(需在法律允许的地区)或通话录音应用
- 导出为 MP3 或 M4A 格式
第二步:上传到 Atter AI
拿到录音文件后,上传到 Atter AI:
- 打开 Atter AI 应用(iOS、Android 或网页版)
- 点击 + 或新建录音按钮
- 选择上传文件,选中你的音频或视频文件
- 支持格式:MP3、MP4、M4A、WAV、MOV、WebM、OGG、FLAC 等更多格式
如需通过 URL 导入(YouTube、云存储链接),使用从 URL 导入功能,而不是上传本地文件。
AI 立即开始处理。60 分钟的会议通常在 4–7 分钟内处理完成。
第三步:设置说话人标注
说话人标注对团队会议至关重要。没有标注的话,逐字稿就是一大段文字,根本看不出谁说了什么。
如何在 Atter AI 中设置说话人:
转录完成后,Atter AI 会自动尝试识别不同声音。你可以:
- 点击任意说话人标签进行重命名(例如将「说话人 1」改为「张明」)
- 自动将同一说话人的所有发言应用相同名称
- 如果你提前知道通话参与者,可以在上传前添加说话人姓名
提升说话人分离效果的技巧:
- 避免两人同时讲话
- 使用耳机而非免提,减少声音串扰
- 对于大型会议(10 人以上),发言较少的说话人可能需要更多人工修正
第四步:设置语言和多语言选项
如果你的会议包含不同语言的发言者,在上传前后配置语言设置:
- 单一语言: Atter AI 自动检测主要语言
- 多语言会议: 启用双语翻译,在原始逐字稿旁并列显示翻译内容
- 支持 90+ 种语言,包括英语、普通话、日语、韩语、西班牙语、法语、德语、葡萄牙语等更多语言
对于国际团队,这省去了转录完成后单独进行翻译的步骤。
第五步:审核 AI 生成的摘要和待办事项
转录完成后,Atter AI 会生成:
摘要: 3–5 句话概述讨论内容、做出的决策和后续步骤。先审核这部分——如果摘要看起来有问题,逐字稿很可能存在音频质量问题需要处理。
待办事项: 会议中提到的任务,自动提取。每个待办事项包含:
- 任务描述
- 负责人(根据「我来…」或「你能…」等表达判断)
- 截止时间(如有提及)
决策记录: 会议中达成的关键结论,与普通讨论内容分开列出。
审核步骤该做什么:
- 确认说话人姓名是否正确
- 核实数字、日期或专有名词(最常见的错误来源)
- 检查待办事项的负责人是否正确
- 补充对话中隐含但未明确表达的背景信息
60 分钟的普通会议,这个审核步骤通常需要 2–5 分钟。
第六步:与团队分享
审核完成后,分享输出内容:
方式 A:分享链接 Atter AI 支持分享安全链接。团队成员可以查看完整逐字稿、跳转到特定时间戳、搜索关键词。
方式 B:导出为 Word 或 PDF 使用导出功能生成格式化文档。适用于外部利益相关方、合规存档,或需要正式文件的客户。
方式 C:复制摘要和待办事项 将摘要和待办事项复制到团队沟通工具(Slack、飞书、邮件、Notion、Jira)立即分发。
推荐的分享方式:
- 向所有会议参与者发送摘要 + 待办事项
- 将完整逐字稿存档到可搜索的位置
- 将待办事项添加到项目管理工具
第七步:建立统一的命名规则
可搜索的逐字稿要能被找到才有用。使用统一的命名格式:
YYYY-MM-DD_[项目名]_[会议类型]
示例:
2026-05-20_产品Alpha_周同步2026-05-20_客户ACME_需求对齐2026-05-20_销售团队_交易复盘
按这种方式存储后,搜索「产品Alpha」就能按时间顺序显示该项目的所有逐字稿。
对比:Atter AI vs Otter AI 自动转录体验
如果你在两个工具之间做选择,以下是自动转录体验的差异:
| 功能 | Atter AI | Otter AI(免费版) |
|---|---|---|
| 准确率 | 98.7%(干净音频) | 约 95% |
| 单次时长限制 | 无限制 | 每次 30 分钟 |
| 每月分钟数 | 不限 | 300 分钟 |
| 语言支持 | 90+ 种 | 以英文为主 |
| 待办事项提取 | 是,自动提取 | 仅付费版 |
| 终身方案 | $129.99(一次性) | 无 |
常见错误及解决方法
错误一:用笔记本扬声器而非耳机录音 这是导致逐字稿质量差最常见的原因。房间回声和环境噪音会显著降低准确率。解决方法:始终使用耳机或外接 USB 麦克风。
错误二:跳过说话人标注步骤 未命名的说话人(「说话人 1」「说话人 2」)会让逐字稿难以阅读。解决方法:转录完成后立即花 60 秒重命名说话人。
错误三:不保存完整逐字稿档案 团队经常只分享摘要,然后原始逐字稿就丢失了。解决方法:使用统一命名规则将每份逐字稿存储在共享文件夹,让任何人都能搜索历史会议。
错误四:忘记告知参与者 在未告知参与者的情况下录制会议会带来法律和信任问题。解决方法:每次会议开始时宣布将被录制并转录。
错误五:把逐字稿当作最终可交付物 逐字稿是原始记录,可交付的是摘要加待办事项。解决方法:在与利益相关方分享之前,始终先生成摘要和待办事项列表。
常见问题
自动转录需要多长时间?
使用 Atter AI,60 分钟的会议通常在 4–7 分钟内处理完成。文件时长、音频质量和当前服务器负载会影响处理时间。
我可以转录已经录好的旧会议吗?
可以。将任何现有的音频或视频文件上传到 Atter AI,即可生成逐字稿。支持格式包括 MP4、MP3、M4A、WAV、MOV 等更多格式。
我需要在转录过程中保持联网状态吗?
不需要。你在会议结束后上传录音文件,不需要与通话保持任何实时连接。
自动转录最佳的麦克风配置是什么?
视频通话时,USB 耳机或专用 USB 桌面麦克风效果最佳。面对面会议时,将录音设备放在桌子中央比依靠笔记本麦克风效果好得多。
Atter AI 能转录多语言会议吗?
可以。Atter AI 支持 90+ 种语言,并能处理带双语翻译的多语言会议。同一份逐字稿中不同语言的说话人段落都能正常处理。
Atter AI 多少钱?
Atter AI 提供终身方案 $129.99(一次性付款)、年度方案 $49.99/年,以及周度方案 $6.99/周。提供 3 天免费试用,无需信用卡。