Transcription

Dictaphone iPhone : ce qu'iOS 18 fait (et ne fait pas)

iOS 18 a ajouté la transcription native aux Mémos Vocaux, mais elle se limite à 12 langues sans étiquetage des locuteurs. Voici comment dépasser ces limites.

Dictaphone est l’enregistreur audio le plus utilisé au monde — préinstallé sur les quelque 2,2 milliards d’iPhone actifs en 2026 — et pendant l’essentiel de son histoire il n’a produit qu’un fichier .m4a, et rien d’autre. La sortie d’iOS 18 en septembre 2024 a enfin ajouté un onglet Transcription dans l’application, mais avec des plafonds rigides que la plupart des gens ne découvrent que quand l’enregistrement compte vraiment : liste blanche de 13 langues, traitement uniquement sur l’appareil et lié à un matériel iPhone précis, et aucune possibilité d’exporter le texte de la transcription lui-même. Deux ans plus tard, dans iOS 26, ces plafonds ont été légèrement relevés mais restent bien réels.

Ce guide passe en revue ce que la transcription intégrée d’Apple sait vraiment faire en 2026, où Dictaphone enregistre les fichiers sur chacune des quatre plateformes qu’il couvre (iPhone, iPad, Mac, Apple Watch), et comment obtenir une transcription complète et modifiable à 98,7% de précision dans 90+ langues grâce à des pipelines d’IA qui fonctionnent sur n’importe quel fichier Dictaphone, quelle que soit la version d’iOS.

Ce que Dictaphone iPhone produit réellement

Chaque enregistrement est un fichier .m4a en compression AAC, mono, dans l’un des deux profils de qualité configurés dans Réglages → Dictaphone → Qualité audio :

RéglageÉchantillonnageDébitTaille pour 60 minutes
Compressé (par défaut)32 kHz~32 kb/s~14 Mo
Sans perte48 kHz~256 kb/s~110 Mo

Le réglage Compressé par défaut est le piège dans lequel la plupart des utilisateurs tombent. À 32 kb/s, l’audio est agréable à l’oreille mais perd les indices vocaux de haute fréquence sur lesquels s’appuie la reconnaissance automatique. Passer en Sans perte avant un entretien important coûte environ 100 Mo par heure et fait monter la précision de la transcription de 3 à 5 points sur n’importe quel moteur, y compris celui d’Apple.

Les noms de fichiers suivent trois règles dans l’ordre : (1) si les Services de localisation sont activés pour Dictaphone, le nouvel enregistrement prend le nom du lieu résolu par GPS (Paris, Bureau, Maison) ; (2) sinon, il hérite du nom du précédent avec un suffixe incrémenté ; (3) en dernier recours, il devient Nouvel enregistrement. Résultat : sur la durée, les bibliothèques sont pleines de fichiers Nouvel enregistrement 47 que personne ne peut identifier sans lecture.

Ce que la transcription native iOS 18+ peut et ne peut pas faire

La vue Transcription apparue dans iOS 18 a été un peu étendue dans iOS 26 mais ses limites restent nettes.

Langues. Le modèle on-device prend en charge environ 13 langues sur iOS 26 : anglais (États-Unis, Royaume-Uni, Australie, Canada, Inde, Singapour, Afrique du Sud), espagnol (États-Unis, Mexique, Espagne), mandarin (Chine continentale, Taïwan), cantonais, français (France, Canada), allemand (Allemagne, Suisse, Autriche), italien, japonais, coréen, portugais (Brésil, Portugal), arabe (Arabie saoudite), russe et turc. Les enregistrements dans toute autre langue — vietnamien, thaï, hindi, hébreu, polonais, néerlandais, langues nordiques, toutes les langues africaines, toutes celles d’Asie du Sud-Est hors vietnamien — ne génèrent aucune transcription. L’onglet Transcription n’apparaît tout simplement pas.

Matériel. La transcription exige un appareil avec Neural Engine A15 ou plus récent : iPhone 13 et postérieurs, iPad mini 6 / iPad Air 5 / iPad Pro 2021 et postérieurs, et tous les Mac Apple Silicon (M1 et au-delà). Les appareils plus anciens affichent l’enregistrement mais jamais la vue Transcription, même si la langue est prise en charge.

Export. Le texte se sélectionne et se copie paragraphe par paragraphe, mais aucune action Exporter la transcription n’existe. Impossible de l’enregistrer en .txt, .docx, .srt ou .vtt. Impossible de partager la transcription séparément de l’audio. La seule façon de récupérer le texte complet sur l’iPhone est l’appui long → Tout sélectionner → copier → coller — et il faut le faire par section au fur et à mesure du défilement.

Précision. Le modèle on-device d’Apple est plus rapide que n’importe quel service cloud (la transcription se fait quasiment en temps réel pendant l’enregistrement), mais reste sensiblement en retrait des meilleurs moteurs cloud. Sur un audio studio propre en anglais américain, il atteint 88–92% de précision par mot ; sur l’audio du micro iPhone dans un café bruyant, il descend dans les 70%. Atter AI plafonne à 98,7% sur audio propre dans n’importe laquelle de ses 90+ langues — l’écart pèse surtout pour les archives interrogeables et les transcriptions à valeur légale.

Ponctuation et étiquettes de locuteurs. La transcription on-device pose une ponctuation de base mais ne fait aucune diarisation. Chaque ligne est attribuée à l’appareil. Un entretien à deux voix se lit comme un long monologue.

Méthode 1 : obtenir une transcription native sur iPhone (iOS 18+)

Sur un appareil et une langue pris en charge :

  1. Ouvrez Dictaphone et touchez un enregistrement.
  2. Touchez l’icône (trois lignes) en haut à droite de la carte d’enregistrement pour ouvrir la vue Transcription. Si l’icône manque, c’est que la langue ou le matériel n’est pas pris en charge.
  3. La transcription s’affiche en texte défilant synchronisé avec la lecture. Touchez n’importe quel mot pour sauter au timecode correspondant.
  4. Pour copier : appui long → Tout sélectionnerCopier. Collez dans Notes, Mail ou n’importe quelle app de texte.

La vue Transcription héberge aussi la fonction Résumer avec Apple Intelligence depuis iOS 24, lorsqu’elle est activée. Les résumés sont courts (3 à 6 puces), générés entièrement sur l’appareil, et n’acceptent qu’un sous-ensemble des langues de transcription — anglais américain, mandarin et quelques autres dans iOS 26.

Méthode 2 : transcription complète avec Atter AI

Pour tout ce que la transcription native d’Apple ne sait pas faire — langues non prises en charge, matériel ancien, export, étiquettes de locuteurs, résumés de plus de six puces — le flux est le même quel que soit le modèle d’iPhone :

  1. Dans Dictaphone, touchez l’enregistrement → bouton Plus (...) → Partager → choisissez Atter AI si l’app est installée, ou Enregistrer dans Fichiers pour un envoi manuel.
  2. Si vous chargez depuis l’app iPhone d’Atter AI, touchez Importer → Dictaphone et l’app lit l’enregistrement directement dans la bibliothèque Dictaphone, sans fichier intermédiaire.
  3. La transcription est typiquement bouclée en 60 à 90 secondes pour un enregistrement de 30 minutes. L’export couvre PDF, DOCX, TXT, SRT, VTT et JSON.
  4. Atter AI propose un essai gratuit de 3 jours couvrant exactement ce parcours. Les offres payantes démarrent à 6,99 USD par semaine, 49,99 USD par an ou 129,99 USD à vie, sans plafond par minute ni par fichier.

Pour les longs entretiens où il faut transcription et résumé, la longueur du résumé Atter AI est configurable (d’un paragraphe au compte-rendu de réunion complet) au lieu des six puces figées d’Apple Intelligence. Le même pipeline alimente aussi le guide de transcription audio en texte et le guide de transcription de podcasts — moteur identique, seule la source d’entrée change.

Méthode 3 : récupérer le .m4a hors de l’appareil

Si vous préférez ne pas installer une app de plus sur le téléphone, sortez d’abord le fichier brut vers un ordinateur :

  • AirDrop vers un Mac proche. Dictaphone → enregistrement → Partager → AirDrop. Le .m4a atterrit dans ~/Téléchargements. Le plus rapide, fonctionne hors ligne.
  • Synchronisation iCloud. Activez Réglages → [Votre nom] → iCloud → Dictaphone. Les enregistrements apparaissent dans Dictaphone sur chaque Mac et iPad connecté. Depuis l’app Mac, glissez l’enregistrement de la barre latérale vers une fenêtre du Finder pour extraire le .m4a.
  • App Fichiers. Sur l’iPhone : Dictaphone → Partager → Enregistrer dans Fichiers → choisissez Sur mon iPhone ou n’importe quel dossier iCloud. L’enregistrement devient visible pour les autres apps et pour le Mac via iCloud Drive.
  • Mail ou Messages. La limite de 25 Mo de pièces jointes Mail couvre les enregistrements Compressés jusqu’à environ 100 minutes ; en Sans perte, le plafond est autour de 12 minutes. iMessage tolère jusqu’à 100 Mo.

Une fois le .m4a sur un ordinateur, glissez-le dans l’uploader web d’Atter AI ou utilisez l’app macOS. Les deux voies produisent la même transcription de qualité cloud.

Méthode 4 : enregistrement sur Apple Watch

La complication Dictaphone d’Apple Watch enregistre directement depuis le micro de la montre, écran éteint — utile pour des conversations de couloir ou des rappels rapides sans sortir le téléphone. La montre enregistre à 16 kHz mono (en dessous des 32 ou 48 kHz de l’iPhone), et les enregistrements se synchronisent vers l’iPhone apparié en 1 à 2 minutes dès que vous ouvrez Dictaphone sur le téléphone, les deux appareils étant en Wi-Fi ou en relais Bluetooth.

L’enregistrement à 16 kHz de la montre suffit à la parole mais réduit nettement la précision de transcription par rapport au micro iPhone. Pour les enregistrements à enjeu, préférez l’iPhone ou un micro filaire/Bluetooth branché sur l’iPhone. Le plafond de batterie d’Apple Watch autour de 100 minutes en enregistrement continu est une autre raison de garder le téléphone par défaut au-delà d’une heure.

Pièges fréquents de la transcription Dictaphone

La synchro iCloud peut prendre du retard. Un enregistrement créé en mode Avion ne se synchronise qu’au retour de la connexion. Si vous AirDropez ou partagez avant la synchro, vous recevez le fichier, mais la vue Transcription locale du Mac peut rester bloquée sur « Génération de la transcription… » indéfiniment, parce que le modèle on-device du Mac travaille sur une autre copie que celle de l’iPhone.

Un appel en cours d’enregistrement le tronque. Si un appel arrive en plein enregistrement, Dictaphone se met en pause et reprend après — mais l’enregistrement n’est scindé en deux fichiers qu’à partir d’iOS 26. Sur iOS 18 et antérieur la pause est silencieuse et le fichier final omet la durée de l’appel sans aucun marqueur.

La réduction de bruit est destructive. Le bouton Améliorer l’enregistrement dans l’éditeur utilise un modèle on-device pour supprimer le bruit de fond. Le fichier traité écrase l’original tant que vous n’avez pas touché Dupliquer d’abord. Pour la transcription, la version améliorée est souvent meilleure ; pour l’archive ou l’usage légal, gardez les deux.

Plafond de 2 Go. Un seul Mémo Vocal ne peut pas dépasser 2 Go. En qualité Sans perte, cela représente environ 18 heures ; en Compressé, environ 138. Quand le plafond est atteint, l’enregistrement s’arrête en silence et le fichier est fermé au timecode déclencheur.

Le résumé Apple Intelligence respecte la liste blanche de langues. Si l’enregistrement est dans une langue non prise en charge par Apple Intelligence (vietnamien, hindi, thaï, etc.), le bouton Résumer est masqué, même sur un appareil qui exécute Apple Intelligence dans d’autres langues. Le résumé Atter AI fonctionne sur 90+ langues sans liste blanche.

Apple natif vs Atter AI

CapacitéDictaphone natif (iOS)Atter AI
Précision sur audio iPhone propre~88–92%98,7%
Langues prises en charge13 (iOS 26)90+
Matériel requisNeural Engine A15+N’importe quel appareil avec navigateur
Étiquettes locuteurs / diarisationAucuneComplète, avec renommage
Formats d’exportAucun (copier-coller uniquement)PDF, DOCX, TXT, SRT, VTT, JSON
Résumé3–6 puces, figéLongueur configurable, compte-rendu structuré
Recherche inter-enregistrementsUn à la foisBibliothèque indexée en plein texte
CoûtGratuit, iPhone récent requis6,99 USD/sem · 49,99 USD/an · 129,99 USD à vie · essai gratuit de 3 jours

Pour les enregistrements de réunions — où Dictaphone sert parfois de dernier filet quand l’hôte a oublié de lancer l’enregistrement dans Zoom ou Teams — associez ce guide au guide de transcription de réunions avec l’IA pour les bonnes pratiques de diarisation et de résumé, tout aussi valables sur un fichier Dictaphone.

FAQ transcription des Mémos Vocaux iPhone

Pourquoi mon enregistrement Dictaphone n’affiche-t-il pas d’onglet Transcription ?

Trois causes possibles. (1) Votre iPhone est antérieur à l’iPhone 13 — le modèle vocal on-device exige le Neural Engine A15 minimum. (2) La langue de l’enregistrement est hors de la liste blanche de 13 langues d’Apple. (3) Vous êtes sous iOS 17 ou antérieur, avant la sortie de la vue Transcription. Dans les trois cas, l’icône est intégralement masquée.

Puis-je exporter la transcription Dictaphone en fichier texte ?

Pas en natif. Apple ne propose aucune action Exporter la transcription dans iOS 26. Vous pouvez tout sélectionner et copier pour coller dans Notes ou Mail, mais pour obtenir un .txt, .docx, .srt ou .vtt, il faut passer l’audio dans un service de transcription comme Atter AI.

iCloud synchronise-t-il la transcription ou seulement l’audio ?

Seulement l’audio. La transcription est régénérée à la demande sur chaque appareil dès la première ouverture de la vue Transcription. Sur les anciens Macs ou iPads qui ne supportent pas le modèle on-device, la transcription n’apparaît jamais même si l’audio se synchronise normalement.

Quelles langues Dictaphone transcrit-il en 2026 ?

Environ 13 sur iOS 26 : anglais (plusieurs régions), espagnol (États-Unis, Mexique, Espagne), mandarin (Chine continentale, Taïwan), cantonais, français (France, Canada), allemand, italien, japonais, coréen, portugais (Brésil, Portugal), arabe (Arabie saoudite), russe et turc. Atter AI couvre 90+ langues dont vietnamien, thaï, hindi, hébreu, polonais, néerlandais, suédois, norvégien, finnois, et la plupart des langues africaines et d’Asie du Sud-Est.

La précision de la transcription Dictaphone est-elle suffisante pour le journalisme ou l’usage juridique ?

Pour des notes type titre, oui — sur audio propre, le modèle on-device d’Apple atteint 88–92%. Pour de la transcription mot-à-mot, du compte-rendu d’audience ou tout contexte où chaque mot doit être exact, non. L’écart de 5 à 10% par rapport à la transcription cloud à 98,7% s’accumule vite sur un entretien d’une heure : ce sont 60 à 120 mots mal compris à retrouver et corriger.

Atter AI a-t-il besoin d’internet pour transcrire un Mémo Vocal ?

Oui. Le moteur Atter AI tourne dans le cloud, ce qui lui permet justement de tenir un plafond de précision plus élevé sur 90+ langues sans dépendre du matériel de l’iPhone. Les fichiers sont chiffrés en transit, transcrits, puis supprimés du stockage temporaire après traitement.

Comment enregistrer directement dans un format transcriptible sans passer par Dictaphone ?

L’app iPhone d’Atter AI enregistre et transcrit simultanément, produisant une transcription pendant l’enregistrement. Le .m4a d’origine est conservé en fichier voisin de la transcription. Cela évite entièrement l’étape d’export et fonctionne dans les 90+ langues prises en charge.

L’app Atter AI peut-elle lire ma bibliothèque Dictaphone existante ?

Oui. La première fois que vous accordez l’accès à Dictaphone dans les Réglages iOS, l’app Atter AI liste tous les enregistrements de votre bibliothèque, triés par date. En sélectionner un importe directement le .m4a sous-jacent, sans passer par la feuille de Partage ni par un enregistrement préalable dans Fichiers.