KI-Transkription

DingTalk (钉钉): KI-Transkription ohne das 30-Minuten-Limit von Shanji

Shanji deckelt die kostenlose Transkription bei 30 Minuten pro Datei. Vollständige DingTalk-Transkription ohne Längenlimit, mehrsprachig und editierbar.

DingTalk (钉钉) ist Alibabas Enterprise-Super-App — 700 Millionen registrierte Nutzer, über 23 Millionen Organisationen auf der Plattform Stand 2025, und die Standard-Arbeitsoberfläche für einen großen Teil der Unternehmen, Behörden und Bildungseinrichtungen in Festland-China. DingTalk Meeting (钉钉会议) ist das in diese Oberfläche eingebettete Videokonferenzmodul, und es verhält sich in drei für die Transkription entscheidenden Punkten ganz anders als Zoom oder Teams: Meetings sind fest an eine DingTalk-Organisation (nicht an ein persönliches Konto) gebunden, Aufzeichnungen landen in DingPan (钉盘) statt in einer eigenständigen Cloud, und die KI-Zusammenfassung — als 闪记 (Shanji, „Flash Notes”) gebrandet — wird von Alibabas Tongyi-Qianwen-LLM angetrieben und erzeugt innerhalb von Sekunden nach Meetingende ein strukturiertes Dokument.

Dieser Leitfaden behandelt die DingTalk-spezifischen Mechaniken: Berechtigungen über Free, Standard, Professional und Exclusive; wo lokale und DingPan-Aufzeichnungen tatsächlich landen; was die nativen Echtzeit-KI-Untertitel und Shanji-Notizen enthalten; und wie man Atter AI obendrauf legt, um 98,7 % Genauigkeit und eine einheitliche Suche über Zoom, Teams, Tencent Meeting und DingTalk hinweg zu bekommen.

DingTalk-Edition-Matrix für Aufzeichnung und Transkription

Aufzeichnung und KI-Funktionen werden über die Edition der Organisation gesteuert, die das Meeting hostet, nicht über den einzelnen Nutzer. Die Matrix für 2026:

EditionLokale AufzeichnungDingPan-Cloud-AufzeichnungEchtzeit-KI-UntertitelShanji-KI-Protokolle (闪记)
Free (免费版)JaBegrenzt (100 GB organisationsweit)JaBegrenzt (3 pro Monat)
Standard (标准版)JaJa (1 TB+)JaJa
Professional (专业版)JaJa (10 TB+)JaJa (erweiterte Vorlagen)
Exclusive (专属版)JaJa (admin-konfiguriert)JaJa (privater Deploy)

Zwei Folgerungen. Erstens, anders als bei Tencent Meeting oder Zoom, erlaubt selbst die kostenlose DingTalk-Edition Cloud-Aufzeichnung — DingPan-Speicher wird organisationsweit geteilt und die Free-Stufe ist auf insgesamt 100 GB gedeckelt, aber die Funktion ist da. Zweitens sind Shanji-Notizen auch in Free verfügbar, nur auf drei Meetings pro Monat pro Organisation begrenzt. Das ökonomische Gating bei DingTalk ist das Speichervolumen, nicht die Funktionsverfügbarkeit.

Was DingTalk nach dem Meeting liefert

Das DingTalk-Aufzeichnungspaket hängt davon ab, ob der Gastgeber lokale oder Cloud-Aufzeichnung gewählt hat — und entscheidend davon, ob AI 智能助理 während des Anrufs eingeschaltet war.

Die lokale Aufzeichnung schreibt auf den Rechner des Gastgebers:

  • .mp4 — die Aufzeichnung, Standard H.264 720p, Audio interleaved.
  • .txt — das Chat-Log des Meetings, nur wenn 保存聊天记录 aktiviert war.

Der Standardpfad unter Windows ist Documents\DingTalk\Meeting\, unter macOS ~/Documents/钉钉会议/. Beide sind unter 设置 → 录制 → 本地录制存储位置 konfigurierbar.

Die Cloud-(DingPan-)Aufzeichnung landet im DingPan-Bereich der Organisation, erreichbar im Desktop-Client unter 工作台 → 钉盘 → 我的录制 und im Web auf dingtalk.com. Du bekommst:

  • Das MP4 im Browser innerhalb von DingTalk streambar.
  • Einen MP4-Download über signierte URL (standardmäßig zwei Stunden gültig).
  • Ein 闪记 Doc (wenn AI 智能助理 lief), mit Zusammenfassung, Entscheidungen, @-attribuierten Aktionen, Schlüssel-Zeitstempeln und klickbarem Themen-Outline.
  • Optional eine .vtt-Untertitel-Spur, falls Echtzeit-Untertitel gespeichert wurden.

Die Standard-DingPan-Aufbewahrung ist dauerhaft, solange das Speicherkontingent der Organisation hält — keine Zeitablauf wie Zooms 30 Tage oder die 7 Tage der Tencent-Meeting-Member-Stufe. Die Falle liegt anders herum: Wenn der Speicher voll ist, entscheidet der Admin, welche alten Aufzeichnungen gelöscht werden, nicht der Gastgeber. Viele Nutzer merken das erst, wenn eine Aufzeichnung nach einer quartalsweisen DingPan-Aufräumaktion der IT verschwunden ist.

Methode 1: DingTalks Echtzeit-KI-Untertitel

DingTalks Echtzeit-Untertitel laufen auf Alibabas Tongyi-Qwen-Sprachmodellen und streamen während des Anrufs.

  1. Im Meeting auf 更多 → 字幕 → 开启字幕 klicken.
  2. Die Untertitelleiste erscheint auf jedem Teilnehmerbildschirm. Die gesprochene Sprache lässt sich auf 中文(普通话), English, 日本語 oder 한국어 stellen (Stand 2026).
  3. Der zweisprachige Modus (Chinesisch + Englisch nebeneinander) ist ab Standard verfügbar.
  4. Damit der Untertitelstrom als Datei erhalten bleibt, muss der Gastgeber vor dem Klick auf 开始录制 保存字幕 im Aufzeichnungspanel aktivieren. Das .vtt wird dann mit der Aufzeichnung in DingPan gebündelt.

Einige DingTalk-spezifische Details:

  • Echtzeit-Untertitel sind selbst in Free kostenlos, aber das Speichern der Untertiteldatei erfordert, dass das Meeting aufgezeichnet wird (jede Edition).
  • Mandarin-Genauigkeit auf Headset-Audio liegt bei rund 89–93 % — Tongyi-Qwens Sprach-Head wird vorrangig auf unternehmens-mandarin-lastigen Korpora trainiert, einschließlich viel Audio aus Business-Meetings, daher schlägt es sich gut bei jargon-lastigen Calls.
  • Die gespeicherte .vtt wird von einem hochwertigeren Offline-Pass erzeugt, nicht vom Live-Untertitelstrom, also liest sie sich spürbar sauberer als die Bildschirm-Captions.
  • DingTalk unterstützt 2026 kein Kantonesisch in den Untertiteln. Für Kantonesisch-Meetings ist Methode 3 oder Methode 5 der Weg.

Methode 2: DingTalks Shanji-KI-Protokolle (闪记)

闪记 ist DingTalks LLM-basierte Meeting-Zusammenfassungsfunktion, getrennt von Echtzeit-Untertiteln, und vermutlich das ausgereifteste native KI-Feature unter den chinesischen Meeting-Plattformen. Sie liefert ein strukturiertes DingDoc (钉钉文档) mit:

  • Einer 5-Punkte-Executive-Summary oben.
  • Entscheidungen, jeweils mit dem Zeitstempel der Entscheidung verknüpft.
  • Aktionen, mit @-Attribution an konkrete DingTalk-Nutzer der Organisation, automatisch als Aufgabe in deren 待办 (To-Do)-Liste gepusht.
  • Einem klickbaren Themen-Outline, der zur passenden Stelle im MP4 springt.

So aktivieren:

  1. Gastgeber oder Co-Gastgeber klickt während des Anrufs auf AI 智能助理 → 开启闪记 (oder setzt es in 个人设置 als Standard).
  2. Nach Meetingende wird das 闪记 Doc bei einem einstündigen Anruf in unter 60 Sekunden erzeugt — deutlich schneller als Tencents 智能纪要 — und erscheint unter 工作台 → 闪记.
  3. Das Doc lässt sich über einen DingTalk-Link teilen (standardmäßig organisationsintern), in DingDoc exportieren oder als Chat-Karte weiterleiten.

闪记 ist in Standard, Professional und Exclusive enthalten. Free ist auf drei Shanji pro Monat pro Organisation begrenzt. Die Zusammenfassung unterstützt Chinesisch und Englisch; englische Zusammenfassungen sind brauchbar, aber sichtbar schwächer als Mandarin-Output.

Methode 3: Atter AI mit DingTalk-Cloud-Aufzeichnungen verbinden

Für Teams, die auf allen DingTalk-Aufzeichnungen konstant höhere Genauigkeit wollen — inklusive Kantonesisch, Code-Switching Mandarin-Englisch, dialektlastige Calls und PSTN-Dial-in-Audio — ist der sauberste Weg die DingPan-plus-Atter-AI-Integration.

  1. In Atter AI Integrations → DingTalk öffnen und auf Authorize klicken.
  2. Der OAuth-Flow öffnet sich auf open.dingtalk.com. Der einloggende Nutzer muss DingTalk-Organisations-Admin sein oder eine explizite Freigabe eines Admins haben — DingTalk lässt in den meisten Editionen keinen Aufzeichnungszugriff auf Einzelnutzerebene zu.
  3. Die Scopes 会议录制 (meeting.recording) und 钉盘 (drive.read) gewähren.
  4. Exclusive-Mandanten brauchen unter Umständen, dass ihr IT-Admin die Atter-AI-App in der DingTalk-Admin-Konsole der Organisation (管理后台 → 第三方应用 → 应用列表) vor-genehmigt, bevor Nutzer installieren können.

Nach Abschluss der Verarbeitung einer DingPan-Aufzeichnung holt Atter AI das MP4 über die signierte Download-URL, die die DingTalk Open Platform ausstellt, führt die Transkription mit auf DingTalks Audioprofil abgestimmter Diarisierung aus und veröffentlicht das Ergebnis in deinem Dashboard neben Zoom-, Teams-, Webex- und Tencent-Meeting-Transkripten.

Die Integration kümmert sich automatisch um den Refresh der signierten URL — das ist wichtig, weil DingTalks signierte URLs standardmäßig nach zwei Stunden ablaufen, kürzer als bei den meisten Plattformen.

Methode 4: Atter-AI-Notetaker-Bot in einem DingTalk-Meeting

Wenn Cloud-Aufzeichnung nicht infrage kommt — Meeting von einer Partnerorganisation gehostet, Gast von außerhalb DingTalk dabei, oder Call, für den dein Admin die Integration nicht aktiviert — lädst du den Atter-AI-Bot als Teilnehmer ein:

  1. Die DingTalk-Meeting-URL (meeting.dingtalk.com/j/<id>) in das Add Meeting-Feld von Atter AI einfügen oder den DingTalk-Kalender verbinden und automatisch beitreten lassen.
  2. Der Bot tritt als „Atter AI Notetaker” bei. Hat der Gastgeber 入会需主持人允许 aktiv, landet er im Warteraum.
  3. Audio wird live erfasst und das Transkript ist Sekunden nach Meetingende fertig.

Einige DingTalk-spezifische Verhaltensweisen, die man kennen sollte:

  • DingTalk Meeting lässt externe (nicht organisationsangehörige) Gäste zu, behandelt sie aber anders — Gäste können selbst keine Aufzeichnung starten, also muss der Bot aus der Gastgeber-Organisation kommen oder explizit eingeladen werden.
  • Verwendet das Meeting 加密会议 (DingTalks 2024 eingeführter E2EE-Modus für Hochsicherheits-Calls), können Drittanbieter-Notetaker per Design nicht teilnehmen.
  • DingTalk setzt eine Admin-Policy namens 允许外部成员入会 durch: Schaltet eine Organisation sie aus, kann der Atter-AI-Bot Meetings ihrer Gastgeber nicht beitreten. Den Admin bitten, Atter AI unter 管理后台 → 会议 → 入会安全策略 auf die Whitelist zu setzen.

Methode 5: Lokale DingTalk-Aufzeichnung hochladen

Für ad-hoc Transkription oder archivierte Calls:

  1. Den DingTalk-Aufzeichnungsordner öffnen (Documents\DingTalk\Meeting\ unter Windows oder ~/Documents/钉钉会议/ unter macOS) und den Meeting-Unterordner mit Namen <Datum>_<Meetingtitel>/ finden.
  2. Die .mp4 in Atter AI hochladen. DingTalks lokale Aufzeichnung erzeugt keine separate Audiodatei, du lädst also das MP4 direkt hoch — Atter AI extrahiert die Audiospur on the fly.
  3. Die Meeting-Sprache wählen. Für ein Mandarin-Englisch-Bilingualmeeting Auto-Detect verwenden, damit Atter AI die Modelle pro Segment wechselt.

Ein 60-minütiges DingTalk-MP4 ist typischerweise in 2–4 Minuten transkribiert.

Stolperfallen bei der DingTalk-Transkription

Speicherkontingent lässt alte Aufzeichnungen verschwinden. DingPan hat keine standardmäßige Zeitablauf, aber ein hartes Speicherlimit (100 GB Free, 1 TB Standard, mehr in höheren Stufen). Bei Erreichen der Grenze entscheidet der Organisations-Admin, welche Aufzeichnungen gelöscht werden. Wenn eine Aufzeichnung wichtig ist, das MP4 in derselben Woche herunterladen.

Admin-only-Aufzeichnung in manchen Exclusive-Deployments. Viele Großunternehmen in Exclusive deaktivieren nutzerinitiierte Aufzeichnung komplett und leiten alles über die IT — dein Gastgeber kann ggf. selbst beim Vorsitz des Meetings die Aufzeichnung nicht starten. Vor dem Call klären.

Externe Gäste sehen das 闪记 Doc oft nicht. Shanji ist standardmäßig organisationsintern; braucht ein externer Partner die Zusammenfassung, muss der Gastgeber das DingDoc explizit extern teilen (und der Organisations-Admin externes Doc-Sharing erlauben).

Kantonesisch wird in DingTalk-Untertiteln nicht unterstützt. Anders als Tencent Meeting, das kantonesische Untertitel mit 75–82 % Genauigkeit unterstützt, unterstützen DingTalks Echtzeit-Untertitel 2026 überhaupt kein Kantonesisch. Kantonesisch-sprachige Teams sollten Methode 3 oder Methode 5 nutzen.

Die mobile Aufzeichnung der DingTalk-App ist nur Audio. Ein per DingTalk-Mobile-App aufgezeichnetes Meeting liefert ein .m4a, kein .mp4. Atter AI akzeptiert beide, aber rechne damit, dass es keine Videospur zum Scrollen gibt.

Shanji hat ein leises 90-Minuten-Limit pro Einzel-Meeting. Längere Meetings werden zwar weiterhin zusammengefasst, aber die Qualität der Aktionsextraktion sinkt merklich. Für ganztägige Workshops die Aufzeichnung vor dem Upload in 60-Minuten-Stücke schneiden.

DingTalk nativ vs Atter AI

FähigkeitDingTalk nativAtter AI
Mandarin-Genauigkeit auf sauberem Audio~89–93 %98,7 %
Kantonesisch-GenauigkeitNicht unterstützt95 %+
Funktioniert in FreeJa (Shanji ratenlimitiert)Ja (über Upload oder Bot)
Bilingual Mandarin-EnglischUntertitel nebeneinanderSprach-Erkennung pro Segment
Aktionen mit Owner-ZuordnungJa (Push in To-Do)Ja
Meeting-übergreifende SucheNur innerhalb DingPanVolltext-indiziert über alle Plattformen
Speaker-Labels für PSTN-EinwahlBegrenztVolle Diarisierung
ExportformateMP4, DingDoc, .vttPDF, DOCX, TXT, SRT, VTT, JSON

Wie DingTalk im Vergleich zu seinen Pendants steht: Anders als Tencent Meeting, wo Cloud-Aufzeichnung über die Edition (Member, Business, Enterprise) gegated und zeitlich gedeckelt ist, gated DingTalk über Speichervolumen und behält Aufzeichnungen unbegrenzt, bis der Organisation der Platz ausgeht. Anders als Zoom, mit pauschaler 30-Tage-Cloud-Aufbewahrung vor automatischer Löschung, gibt DingTalk die Aufbewahrungshoheit komplett an den Organisations-Admin ab. Und anders als Microsoft Teams, wo Aufzeichnungen in OneDrive fließen und die Microsoft-365-Retention erben, leben DingTalk-Aufzeichnungen in DingPan und erben die Alibaba-Cloud- + Organisations-IT-Policy.

FAQ zur DingTalk-Transkription

Erlaubt die kostenlose DingTalk-Edition Aufzeichnungen?

Ja. Anders als bei Zoom oder Tencent Meeting erlaubt selbst die kostenlose DingTalk-Edition sowohl lokale als auch DingPan-Cloud-Aufzeichnung. Die Einschränkungen sind der Gesamt-Speicher (100 GB organisationsweit) und ein Limit von drei Shanji pro Monat. Free-Nutzer mit Bedarf an einem vollständigen Transkript sollten den Upload zu Atter AI für eine höhere Genauigkeitsgrenze und unbegrenzte „Shanji-Äquivalente” in Erwägung ziehen.

Wo werden DingTalk-Lokal-Aufzeichnungen genau gespeichert?

Unter Windows in Documents\DingTalk\Meeting\, unter macOS in ~/Documents/钉钉会议/. Der Pfad ist im Desktop-Client unter 设置 → 录制 → 本地录制存储位置 konfigurierbar. Jedes Meeting bekommt einen eigenen Unterordner, benannt mit Datum und Meetingtitel.

Wie lange behält DingTalk Cloud-Aufzeichnungen?

Unbegrenzt, bis das DingPan-Speicherkontingent der Organisation voll ist. Keine automatische zeitbasierte Ablauflogik. Wenn der Speicher allerdings ausgeht, entscheidet der Organisations-Admin, welche Aufzeichnungen gelöscht werden — Einzel-Gastgeber sollten also nicht annehmen, ihre Aufzeichnungen seien für immer sicher. Wichtiges herunterladen.

Transkribiert DingTalk Kantonesisch genau?

Nein — die Echtzeit-KI-Untertitel von DingTalk unterstützen Kantonesisch 2026 nicht. Unterstützt werden nur Mandarin, Englisch, Japanisch und Koreanisch. Für Kantonesisch-Transkription die Aufzeichnung zu Atter AI hochladen, das mit Kantonesisch-spezifischen akustischen Modellen 95 %+ Genauigkeit erreicht.

Kann der Atter-AI-Notetaker einem DingTalk-Meeting beitreten, das eine andere Organisation hostet?

Ja, sofern die Host-Organisation 允许外部成员入会 aktiviert hat. Wenn nicht, wird der Bot in der Eintrittssicherheitsrichtlinie abgelehnt — den Admin des Hosts bitten, Atter AI auf die Whitelist zu setzen, oder Methode 5 (späterer Upload) nutzen.

Ist Shanji (闪记) dasselbe wie Echtzeit-KI-Untertitel?

Nein. Echtzeit-Untertitel sind der Live-Caption-Strom auf dem Bildschirm, optional als .vtt speicherbar. Shanji ist ein separates Post-Meeting-DingDoc mit Zusammenfassung, Entscheidungen, in die To-Do gepushte Aktionen und klickbarem Themen-Outline. Untertitel und Shanji können unabhängig voneinander laufen — eines ohne das andere ist möglich.

Kann ich ein von jemand anderem aufgezeichnetes DingTalk-Meeting transkribieren?

Ja — die andere Person teilt die MP4 per DingTalk-Chat oder DingPan-Share-Link mit dir, du lädst sie über Methode 5 in Atter AI hoch. Dein Atter-AI-Konto muss nicht mit ihrer DingTalk-Organisation verbunden sein.

Integriert sich Atter AI für Aktionen mit DingTalks 待办-Liste?

Ja, über die Task-API der DingTalk Open Platform. Nach Autorisierung (Methode 3) können von Atter AI extrahierte Aktionen zusätzlich zum (oder anstelle des) nativen Shanji-Pushes in die DingTalk-待办 des Verantwortlichen gepusht werden, sodass plattformübergreifende Teams, die DingTalk zusammen mit Slack oder Notion nutzen, eine konsistente Task-Oberfläche bekommen.