Memorandos de Voz é o gravador de áudio mais usado do mundo — pré-instalado em cerca de 2,2 bilhões de iPhones ativos em 2026 — e durante quase toda a sua história só produzia um arquivo .m4a e absolutamente nada mais. O lançamento do iOS 18, em setembro de 2024, finalmente trouxe a tela de Transcrição dentro do app, mas chegou com tetos rígidos que a maioria dos usuários só descobre quando a gravação já importa: lista branca de 13 idiomas, processamento exclusivamente no aparelho atrelado a hardware específico do iPhone, e nenhuma exportação do texto da transcrição em si. Dois anos depois, no iOS 26, esses tetos estão um pouco mais altos, mas continuam reais.
Este guia cobre o que a transcrição embutida da Apple realmente faz em 2026, onde Memorandos de Voz salva os arquivos em cada uma das quatro plataformas em que roda (iPhone, iPad, Mac e Apple Watch) e como obter uma transcrição completa e editável com 98,7% de precisão em 90+ idiomas usando pipelines de IA que funcionam sobre qualquer arquivo de Memorandos de Voz, independentemente da versão do iOS.
O que Memorandos de Voz do iPhone realmente produz
Toda gravação é um arquivo .m4a com compressão AAC, mono, em um dos dois presets configurados em Ajustes → Memorandos de Voz → Qualidade do áudio:
| Ajuste | Taxa de amostragem | Bitrate | Tamanho de 60 minutos |
|---|---|---|---|
| Comprimido (padrão) | 32 kHz | ~32 kbps | ~14 MB |
| Sem perdas | 48 kHz | ~256 kbps | ~110 MB |
O ajuste Comprimido padrão é a armadilha em que a maioria cai. A 32 kbps o áudio soa bem para o ouvido humano, mas perde as pistas de fala em alta frequência das quais o reconhecimento automático depende. Mudar para Sem perdas antes de uma entrevista importante custa cerca de 100 MB por hora e eleva a precisão da transcrição em 3 a 5 pontos percentuais em qualquer motor, incluindo o da própria Apple.
O nome do arquivo segue três regras na ordem: (1) se Serviços de Localização estiverem ativos para Memorandos de Voz, a nova gravação recebe o nome do local resolvido por GPS (São Paulo, Casa, Escritório); (2) caso contrário, herda o nome da gravação anterior com sufixo incremental; (3) como último recurso, volta a Nova Gravação. O resultado é que bibliotecas antigas ficam cheias de arquivos chamados Nova Gravação 47 que ninguém consegue identificar sem reproduzir.
O que a transcrição nativa do iOS 18+ pode e não pode fazer
A tela de transcrição que estreou no iOS 18 foi levemente expandida no iOS 26, mas os limites continuam claros.
Idiomas. O modelo no aparelho suporta cerca de 13 idiomas no iOS 26: inglês (EUA, RU, AU, CA, IN, Singapura, África do Sul), espanhol (EUA, México, Espanha), mandarim (China continental, Taiwan), cantonês, francês (França, Canadá), alemão (Alemanha, Suíça, Áustria), italiano, japonês, coreano, português (Brasil, Portugal), árabe (Arábia Saudita), russo e turco. Gravações em qualquer outro idioma — vietnamita, tailandês, hindi, hebraico, polonês, holandês, línguas nórdicas, todos os idiomas africanos e do sudeste asiático fora o vietnamita — não geram nenhuma transcrição. A aba Transcrição simplesmente não aparece.
Hardware. A transcrição exige um dispositivo com Neural Engine A15 ou mais novo: iPhone 13 em diante, iPad mini 6 / iPad Air 5 / iPad Pro 2021 em diante, e todos os Macs com Apple Silicon (M1 em diante). Aparelhos mais antigos exibem a gravação mas nunca a tela de Transcrição, mesmo quando o idioma é suportado.
Exportação. O texto pode ser selecionado e copiado parágrafo a parágrafo, mas não existe ação Exportar transcrição. Não dá para salvar como .txt, .docx, .srt ou .vtt. Não dá para compartilhar a transcrição separada do áudio. A única forma de extrair o texto completo no iPhone é manter pressionado → Selecionar Tudo → Copiar → Colar — e isso seção por seção rolada.
Precisão. O modelo no aparelho da Apple é mais rápido que qualquer serviço em nuvem (a transcrição acontece quase em tempo real durante a gravação), mas fica atrás dos melhores motores em nuvem por uma margem significativa. Em áudio limpo de estúdio em inglês americano, o modelo on-device fica em 88–92% de precisão por palavra; em áudio do microfone do iPhone num café barulhento, cai para os 70%. Atter AI atinge 98,7% em áudio limpo em qualquer um de seus 90+ idiomas suportados — a diferença pesa mais em arquivos pesquisáveis e em transcrições de uso jurídico.
Pontuação e rótulos de falante. A transcrição on-device insere pontuação básica mas não faz nenhuma diarização. Toda linha é atribuída ao aparelho. Uma entrevista entre duas pessoas lê-se como um monólogo contínuo.
Método 1: obter transcrição nativa no iPhone (iOS 18+)
Em dispositivo suportado com idioma suportado:
- Abra Memorandos de Voz e toque uma gravação.
- Toque no ícone ≡ (três linhas) no canto superior direito do cartão da gravação para abrir a tela Transcrição. Se o ícone não aparecer, o idioma ou o hardware não são suportados.
- A transcrição aparece como texto rolável sincronizado com a reprodução. Toque em qualquer palavra para pular para aquele timestamp.
- Para copiar: manter pressionado → Selecionar Tudo → Copiar. Cole em Notas, Mail ou qualquer app de texto.
A tela Transcrição também abriga o recurso Resumir com Apple Intelligence do iOS 24+ (quando ativado). Os resumos são curtos (3 a 6 bullets), gerados inteiramente no aparelho, e suportam um subconjunto dos idiomas de transcrição — inglês americano, mandarim e alguns outros no iOS 26.
Método 2: transcrição completa com Atter AI
Para tudo o que a transcrição nativa da Apple não faz — idiomas não suportados, hardware antigo, exportação de arquivo, rótulos de falante, resumos com mais de seis bullets — o fluxo é o mesmo, qualquer que seja o modelo do iPhone:
- Em Memorandos de Voz, toque a gravação → toque no botão Mais (
...) → Compartilhar → escolha Atter AI se o app estiver instalado, ou Salvar em Arquivos para enviar manualmente. - Se estiver enviando pelo app iPhone do Atter AI, toque em Importar → Memorandos de Voz e o app lê a gravação direto da biblioteca, sem arquivo intermediário.
- A transcrição costuma terminar em 60–90 segundos para uma gravação de 30 minutos. A saída suporta PDF, DOCX, TXT, SRT, VTT e JSON.
- Atter AI oferece teste gratuito de 3 dias cobrindo exatamente esse fluxo. Os planos pagos começam em US$ 6,99 por semana, US$ 49,99 por ano ou US$ 129,99 vitalício, sem teto por minuto ou por arquivo.
Para entrevistas longas em que você precisa de transcrição e resumo, o tamanho do resumo do Atter AI é configurável (de um parágrafo a uma ata completa), em vez dos seis bullets fixos do Apple Intelligence. O mesmo pipeline alimenta também o guia de transcrição de áudio para texto e o guia de transcrição de podcasts — o motor é o mesmo, só muda a fonte de entrada.
Método 3: tirar o .m4a do aparelho
Quando você prefere não instalar outro app no celular, leve primeiro o arquivo bruto para o computador:
- AirDrop para um Mac próximo. Memorandos de Voz → gravação → Compartilhar → AirDrop. O
.m4acai em~/Downloads. Caminho mais rápido; funciona offline. - Sincronização iCloud. Ative Ajustes → [Seu nome] → iCloud → Memorandos de Voz. As gravações aparecem no app Memorandos de Voz em todo Mac e iPad logado. No app do Mac, arraste a gravação da barra lateral para uma janela do Finder para extrair o
.m4a. - App Arquivos. No iPhone: Memorandos de Voz → Compartilhar → Salvar em Arquivos → escolha No Meu iPhone ou qualquer pasta iCloud. A gravação fica visível para outros apps e para o Mac via iCloud Drive.
- E-mail ou Mensagens. O limite de 25 MB de anexos do Mail cobre gravações em qualidade Comprimida de até cerca de 100 minutos; em Sem perdas, o teto fica em torno de 12 minutos. O iMessage aceita arquivos de até 100 MB.
Com o .m4a no computador, arraste-o para o uploader web do Atter AI ou use o app macOS. Qualquer caminho gera a mesma transcrição em nível cloud.
Método 4: gravação no Apple Watch
A complicação de Memorandos de Voz no Apple Watch grava direto do microfone do relógio, com a tela apagada — útil para conversas de corredor ou lembretes rápidos sem tirar o iPhone do bolso. O relógio grava em 16 kHz mono (abaixo dos 32 ou 48 kHz do iPhone) e as gravações sincronizam com o iPhone pareado em 1–2 minutos depois que você abre Memorandos de Voz no telefone, com ambos em Wi-Fi ou via handoff Bluetooth.
A gravação de 16 kHz do relógio é suficiente para fala, mas reduz visivelmente a precisão da transcrição em relação ao microfone do iPhone. Para gravações importantes, prefira o iPhone ou um microfone com fio/Bluetooth conectado ao iPhone. O teto de bateria do Apple Watch de cerca de 100 minutos em gravação contínua é outro motivo para usar o telefone como padrão em durações acima de uma hora.
Pegadinhas comuns da transcrição de Memorandos de Voz
A sincronização do iCloud pode atrasar. Gravações criadas no modo avião só sincronizam quando o aparelho volta a ter conexão. Se você fizer AirDrop ou compartilhar antes da sincronização, recebe o arquivo, mas a tela local de Transcrição no Mac pode ficar travada em «Gerando transcrição…» indefinidamente, porque o modelo on-device do Mac está processando uma cópia diferente da do iPhone.
Ligações no meio da gravação a truncam. Se uma ligação chega no meio da gravação, Memorandos de Voz pausa e retoma após o término — mas a gravação só é dividida em dois arquivos a partir do iOS 26. No iOS 18 e anteriores a pausa é silenciosa e o arquivo final omite o tempo da ligação sem nenhuma marcação.
A remoção de ruído é destrutiva. O botão Aprimorar gravação no editor usa um modelo on-device para tirar o ruído de fundo. O arquivo processado sobrescreve o original, a menos que você toque em Duplicar antes. Para transcrição, a versão aprimorada costuma ser melhor; para arquivo ou uso jurídico, mantenha as duas.
Teto de 2 GB. Um único Memorando de Voz não pode ultrapassar 2 GB. Em qualidade Sem perdas, são cerca de 18 horas; em Comprimida, cerca de 138. Gravações que batem no teto param em silêncio e o arquivo é fechado no timestamp que disparou o limite.
O resumo do Apple Intelligence respeita a lista branca de idiomas. Se a gravação está num idioma não suportado pelo Apple Intelligence (vietnamita, hindi, tailandês, etc.), o botão Resumir fica escondido mesmo num aparelho que roda Apple Intelligence em outros idiomas. O resumo do Atter AI funciona em 90+ idiomas sem lista branca.
Apple nativo vs Atter AI
| Capacidade | Memorandos de Voz nativo (iOS) | Atter AI |
|---|---|---|
| Precisão com áudio limpo do iPhone | ~88–92% | 98,7% |
| Idiomas suportados | 13 (iOS 26) | 90+ |
| Hardware exigido | Neural Engine A15+ | Qualquer dispositivo com navegador |
| Rótulos de falante / diarização | Nenhum | Completo, com renomeação |
| Formatos de exportação | Nenhum (só copiar e colar) | PDF, DOCX, TXT, SRT, VTT, JSON |
| Resumo | 3–6 bullets, fixo | Tamanho configurável, ata estruturada |
| Busca entre gravações | Uma de cada vez | Biblioteca indexada por texto completo |
| Custo | Grátis, exige iPhone recente | US$ 6,99/sem · US$ 49,99/ano · US$ 129,99 vitalício · teste grátis de 3 dias |
Para gravações de reuniões — onde Memorandos de Voz é, às vezes, a única rede de segurança porque o anfitrião esqueceu de gravar no Zoom ou no Teams — combine este guia com o guia de transcrição de reuniões com IA para as melhores práticas de diarização e resumo, igualmente aplicáveis a um arquivo de Memorandos de Voz.
Perguntas frequentes sobre transcrição de Memorandos de Voz do iPhone
Por que minha gravação de Memorandos de Voz não mostra a aba Transcrição?
Três razões possíveis. (1) Seu iPhone é mais antigo que o iPhone 13 — o modelo de voz on-device exige Neural Engine A15 ou superior. (2) O idioma da gravação está fora da lista branca de 13 idiomas da Apple. (3) Você está no iOS 17 ou anterior, antes do lançamento da tela Transcrição. Qualquer dos três esconde o ícone por completo.
Posso exportar a transcrição de Memorandos de Voz como arquivo de texto?
Nativamente, não. A Apple não oferece ação Exportar transcrição no iOS 26. Dá para selecionar tudo e copiar, colando em Notas ou Mail, mas para obter .txt, .docx, .srt ou .vtt é preciso passar o áudio por um serviço de transcrição como o Atter AI.
O iCloud sincroniza a transcrição ou só o áudio?
Só o áudio. A transcrição é gerada de novo, sob demanda, em cada aparelho, na primeira vez que você abre a tela Transcrição ali. Em Macs ou iPads antigos sem suporte ao modelo on-device, a transcrição nunca aparece, embora o áudio sincronize normalmente.
Quais idiomas Memorandos de Voz transcreve em 2026?
Cerca de 13 no iOS 26: inglês (várias regiões), espanhol (EUA, México, Espanha), mandarim (China continental, Taiwan), cantonês, francês (França, Canadá), alemão, italiano, japonês, coreano, português (Brasil, Portugal), árabe (Arábia Saudita), russo e turco. O Atter AI cobre 90+ incluindo vietnamita, tailandês, hindi, hebraico, polonês, holandês, sueco, norueguês, finlandês, e a maioria das línguas africanas e do sudeste asiático.
A precisão da transcrição de Memorandos de Voz do iPhone é suficiente para jornalismo ou uso jurídico?
Para notas no estilo manchete, sim — em áudio limpo o modelo on-device da Apple chega a 88–92%. Para transcrições literais, registros judiciais ou qualquer contexto em que cada palavra precise estar certa, não. A diferença de 5–10% em relação à transcrição em nuvem de 98,7% se acumula rápido numa entrevista de uma hora: são 60 a 120 palavras mal entendidas que você precisa encontrar e corrigir.
O Atter AI precisa de internet para transcrever um Memorando de Voz?
Sim. O motor do Atter AI roda em nuvem, e é o que permite sustentar um teto de precisão mais alto em 90+ idiomas sem depender do hardware do iPhone. Os arquivos são criptografados em trânsito, transcritos e apagados do armazenamento temporário depois do processamento.
Como gravo direto em um formato transcrivível sem usar Memorandos de Voz?
O app iPhone do Atter AI grava e transcreve em paralelo, produzindo uma transcrição enquanto você grava. O .m4a original é preservado como arquivo irmão da transcrição. Isso evita o passo de exportação por completo e funciona em todos os 90+ idiomas suportados.
O app Atter AI consegue ler da minha biblioteca atual de Memorandos de Voz?
Sim. Na primeira vez que você concede acesso a Memorandos de Voz nos Ajustes do iOS, o app Atter AI lista todas as gravações da biblioteca em ordem cronológica. Ao selecionar uma, o .m4a base é importado diretamente, sem precisar passar pela tela de Compartilhar ou pelo Arquivos.