Education

老师和教授的录音转文字指南:那件你终于能甩给机器的无障碍活儿

美国司法部新规要求 2026 年 4 月前公立大学讲课视频必须配字幕。用录音转文字把一堂课变成合规字幕、复习资料和办公室答疑记录。

快速答案

对老师来说,录音转文字的用法跟学生正好反过来。学生录音是为了跟上进度;你录音是为了反馈出去——给第三排那个听障学生的字幕,给请病假那个孩子的可搜索文字稿,给屏幕阅读器能真正读懂的一份干净讲课文本。录音转文字能在几分钟内把一堂录下来的课变成准确率 98.7% 的文字稿,然后你拿它去做字幕、做复习资料、做无障碍课件——而不是花每音频分钟 1 到 7.5 美元请字幕外包公司一个字一个字敲。

而且现在这事有个截止日期了,所以我才专门写给授课老师。美国司法部 2024 年 4 月在《美国残疾人法案》第二编下出台的新规,要求公立大学和学院把网络内容——包括讲课视频——做到 WCAG 2.1 AA 标准。大型院校的大限是 2026 年 4 月,小院校是 2027 年 4 月。字幕不再是「有空再说」的选项了。它是日历上一个具体的日子。

2024 年到底变了什么,为什么这事落到你头上

很多年来,讲课字幕一直是个「回头再弄」的活儿——有学生拿着正式的残障证明来申请,才被动处理一下,没人申请就当它不存在。2024 年 4 月这条司法部终版规则,给公立院校的「被动模式」画上了句号。网络和移动端内容必须达到 WCAG 2.1 AA 级,而录制的讲课视频,正好稳稳落在这个范围里。

这里有个坑,很多老师没防到:合规不是无障碍办公室一家能扛下来的事。内容的源头是你。一堂 50 分钟的课大约是 7500 个口语词,每一个词都得变成准确、同步的文字,落在学生读得到的地方。一学期三门课、十五周排下来,单是一位老师,每学期就是五十多万字的字幕量。

2026年4月
大型公立大学 WCAG 2.1 AA 合规大限(司法部 ADA 第二编规则)
~7,500
一堂 50 分钟讲课包含的口语词数
$1–$7.50
人工字幕外包公司收取的每音频分钟单价
90+
支持的语言数量,应对多语言课堂

把这些全外包给人工字幕公司,就算按每分钟 1 美元这个地板价算,单是一位老师一学期也得几千美元,而且交付周期是按天算的,不是按分钟。学生周四晚上发邮件,要周二那节课的文字稿——你总不能让人家等下个礼拜吧。这正是录音转文字补上的缺口:近乎即时的草稿级文本,你拿来改,而不是从零写。

老师真正会拿文字稿干的五件事

字幕是义务。但它不是唯一的回报,老实说还不是最有意思的那个。一旦你手里有每堂课的准确文字稿,一大堆别的活儿都跟着变轻松了。

  1. 生成字幕和无障碍文字稿上传讲课录音,拿回一份带说话人标记的文字稿,扫一遍模型搞砸的专业术语,导出。这一步既盖住了 WCAG 义务,也照顾了那些读得比听得快的学生。
  2. 用你自己的原话做复习资料把文字稿压缩成关键术语表、摘要、一组复习题。学生拿到的是你的措辞,不是教材的措辞——而考试考的恰恰是你的措辞。
  3. 留一份办公室答疑和指导的记录在学生同意的前提下,一份论文指导的文字记录,能让三周后没人再来扯「可您当时说的是」。记录就是记录。
  4. 记录教师会议和委员会工作行政事务是学术生活里那笔没人付钱的税。课程委员会会议的文字稿能自己生成纪要,你就不用再主动揽下记录这活儿了。
  5. 转写研究访谈如果你做质性研究,访谈转写是同一套流程——也是你过去要专门走转写预算的那笔时间。

第二条比看起来重要。学生复习靠的是他们在课上听到的那些词,而你那句「选择压力」或者「社会契约」的具体说法,才是会出现在你卷子上的版本。从文字稿提炼出来的复习资料,比任何出版社的摘要都更贴近考试。学生那一侧的玩法——把一堂课变成记忆卡片和复习单——在把录播课变成 AI 学习笔记里写得很清楚;读一遍,你就知道学生拿你给的录音在干什么了。

准确率到底会在哪儿崩(以及怎么别让它崩)

阶梯教室是个相当不友好的录音环境,假装不是这样,老师最后只会失望。98.7% 是干净音频的数字——安静的房间、近距离麦克风、口齿清楚的说话人。你的现实是:空调嗡嗡响,一个离嘴 40 厘米的领夹麦你前八分钟忘了打开,还有你正对着喊话的后三排。

而且错误不是随机撒的。它们恰好扎堆在最要命的那些词上:学科专有词汇、专有名词、外语术语,还有任何写在黑板上、压根没进音频通道的东西。「威斯特伐利亚和约」可能转成「西边伐木和约」。你的学生一眼就看出来。所以流程永远不是「转完就发」——而是先转,再花五分钟扫一遍那十几个模型注定会错的术语。

录音转文字是对的工具,当……

  • 你需要规模化出字幕和文字稿,每周都要,还卡着截止日期
  • 音频是用专门的麦克风录的,不是靠教室的环境声
  • 你能事后花几分钟改一改专业术语
  • 同一堂课要服务说多种语言的学生

该找人工字幕,当……

  • 内容法律风险高,标准是零错误(正式的残障便利文件指定了逐字认证字幕)
  • 音频是真的没救了——严重串音、没有可用的麦克风
  • 你有预算,也耗得起按天算的交付周期

两个习惯能解决大部分问题。用一个夹式麦或 USB 麦,别信任整个教室;开录前先看一眼录音电平,不是录完才看。准确率最大的那根杠杆,说白了不是软件——是你嘴和麦克风之间那 40 厘米。这个搞对了,后面那遍修改几乎缩成零。

多语言课堂,是被严重低估的那块收益

这里有个角度,合规备忘录里从来不写。大型研究型大学里,大约每九个学生就有一个是在用非母语学习。对他们来说,实时听课是个残酷的任务——听、解析第二语言、做笔记,三件事同时进行,还没有倒带键。

给他们一份文字稿,你就把这个不可能的实时任务,变成了一个能搞定的阅读任务。句子可以重读,可耳朵没法重听。靠着 90+ 种语言支持,你用英语讲的一堂课,可以先用录音转文字转出来,再让一个母语是中文、西班牙语或韩语的学生按阅读速度慢慢啃。你没改变你的教法。你只是拿掉了「用非母语处理信息速度慢」这件事的惩罚。对于那些已经躺在视频平台上、不在教室里的课,大学讲座录音转文字把教室声学那一面讲得更深;而学生侧的录音转文字攻略也值得扫一眼,看看这套流程从他们那头看是什么样。

到了学期末,这些文字稿会变成比字幕更大的东西:一份你整学期说过什么的可搜索记录。学生问「您讲过 X 吗」,你不用再猜了——直接搜。这个机制本身就是个小超能力,用 AI 对话搜索文字稿里有讲。

跟字幕预算比,到底花多少钱

这笔账好算,因为对比太悬殊了。人工字幕公司收每音频分钟 1 到 7.5 美元。一堂 50 分钟的课,按低价算也是 50 美元;一门课一学期轻松到 750 到 1000 美元,这还没算研究访谈和委员会会议。

Atter AI 是一口价:每周 $6.99、每年 $49.99,或者 $129.99 终身买断,外加 3 天免费试用,关键是单个文件没有时长上限——三小时的研究生研讨课和二十分钟的辅导课走同一个流程。对一个每周都要干这事的老师来说,年付的钱还不够请人工给两堂课配字幕的。免费试用是最诚实的第一步:在你真实的教室、用你真实的麦克风,录一堂真实的课,转出来,拿你自己的声学环境去判断准确率,而不是看一个跑分。你买的是你那间教室,不是宣传页。

有一条边界得说清楚:一份指定了「逐字认证」字幕的正式残障便利文件,是个法律文书,你得一字不差地照办——这种情况就是人工字幕,没得商量。录音转文字负责的是宽泛的 WCAG 底线,以及在这之上所有自愿多做的部分。两者不是对手,它们覆盖的是不同的义务。

常见问题

录音转文字能满足 ADA / WCAG 2.1 AA 的字幕要求吗?

对于司法部 2024 年规则要求的那条 WCAG 2.1 AA 通用底线,由录音转文字生成、并且经过校对的字幕是达标的——关键词是「校对」。带错误的原始自动字幕不算,WCAG 要求字幕准确且同步。所以合规的流程是录音转文字加一遍人工审核,专门盯那些技术术语。而一份要求逐字认证字幕的正式残障便利文件,是另一条更高的线,通常得交给人工字幕服务。

真实讲课的录音,不是录音棚那种,准确率有多高?

Atter AI 在干净音频上能稳到 98.7%,但阶梯教室可不是干净音频。离麦克风的距离、房间混响、环境噪声,都会吃掉准确率,而且错误集中在学科专有词汇和专有名词上。最管用的两个补救:用夹式麦或 USB 麦,别用教室的环境声;开录前一分钟先确认录音电平。然后留五分钟事后改那些专业术语。

我能转用其他语言讲、或者中外混讲的课吗?

能——支持 90+ 种语言,包括中途切换语言的课,这在国际项目和语言教学项目里很常见。这也正是文字稿对那大约九分之一用非母语学习的学生格外有价值的地方:它把一个不可能的实时听力任务,变成了一个能搞定的阅读任务。

录自己的课需要学生同意吗?

录自己讲课用于无障碍和课件,一般在老师的权限范围内,但有两点要当心。第一,如果录音里有学生说话——提问、讨论、研讨——他们的声音可能受隐私和录音同意规则约束,所以要告知本节课在录音。第二,永远照学校的具体规定走,它可能比法律更严。办公室答疑或一对一指导,录之前先拿到明确同意。

会不会撞上文件时长或每月用量上限?

单个文件没有时长上限,这对教育工作者正是关键——三小时的研究生研讨课和二十分钟的辅导课转起来一样,不用焦虑哪堂课「配得上」被录。正是这种一口价结构,才让每周、每堂课都配字幕这件事真的可行,而不是被配额掐着。

跟手工干比,现实里能省多少时间?

人工把一堂 50 分钟的课转成文字,一个熟练打字员大概要四个小时;录音转文字几分钟就给你一份草稿,你修专业术语那一遍跑五到十分钟。跟人工字幕公司比,你还把按天算的交付周期换成了近乎即时的结果——这就是周四晚上的请求当晚回掉、还是拖到下个礼拜的区别。