DSGVO-konforme Forschungstranskription: Ein Leitfaden für Wissenschaftler

2026-04-06 · Scribeer

Das Dilemma der Forschenden

Sie führen eine Studie mit sensiblen Daten durch. Tiefeninterviews mit Patienten, Geflüchteten, Missbrauchsüberlebenden oder Whistleblowern. Die Aufnahmen enthalten Namen, medizinische Details, Wohnorte und zutiefst persönliche Geschichten. Ihre Ethikkommission hat die Studie unter strengen Auflagen genehmigt: Die Daten müssen vertraulich behandelt und anonym verarbeitet werden.

Jetzt müssen Sie diese Interviews transkribieren.

Die meisten Transkriptionsdienste verlangen, dass Sie Audio auf ihre Server hochladen. Aber wo befinden sich diese Server? Wer hat Zugang? Werden die Audiodaten zum Training von KI-Modellen genutzt? Und wie verhält sich das zu den Versprechen, die Sie Ihren Teilnehmenden gegeben haben?

Warum Standarddienste nicht ausreichen

Die meisten Transkriptionsplattformen sind auf Komfort ausgelegt, nicht auf Vertraulichkeit. Sie verarbeiten Audio auf Servern in den Vereinigten Staaten, speichern Dateien tagelang oder wochenlang und setzen manchmal menschliche Prüfer für die Qualitätssicherung ein. Das bedeutet: Echte Menschen können Ihre sensiblen Interviews hören.

Für Forschende, die unter DSGVO-Anforderungen und ethischen Protokollen arbeiten, ist das inakzeptabel. Die DSGVO verlangt, dass personenbezogene Daten nur mit einer gültigen Rechtsgrundlage und mit angemessenen technischen und organisatorischen Schutzmaßnahmen verarbeitet werden. Übermittlungen außerhalb des EWR unterliegen nach dem Schrems-II-Urteil des EuGH verschärften Anforderungen.

Was Forschende tatsächlich brauchen

Eine Transkriptionslösung für die akademische Forschung muss vier Anforderungen erfüllen.

1. Datenspeicherort und Rechtszuständigkeit

Verarbeitung innerhalb der EU, auf Servern, die dem europäischen Datenschutzrecht unterliegen. Keine Übermittlungen in die USA oder andere Drittstaaten.

2. Verschlüsselung

Daten müssen sowohl bei der Übertragung (TLS 1.3) als auch im Ruhezustand (AES-256) verschlüsselt sein. Im Idealfall kann selbst der Dienstanbieter den Inhalt nicht lesen.

3. Datensparsamkeit

Audio wird unmittelbar nach der Verarbeitung automatisch gelöscht. Keine Langzeitspeicherung, keine Nutzung für Modelltraining, kein Zugriff durch Mitarbeiter des Anbieters.

4. Option zur lokalen Verarbeitung

Für die sensibelsten Daten muss es eine Möglichkeit geben, die Transkription vollständig auf dem eigenen Gerät der Forschenden durchzuführen, ohne dass Daten das Gerät verlassen.

Wie Scribeer diese Anforderungen erfüllt

EU-gehostete Cloud mit Verschlüsselung

Der Cloud-Modus verarbeitet Audio auf Servern in Frankfurt, Deutschland. Die Verbindung ist mit TLS 1.3 verschlüsselt, und Transkripte werden mit AES-256 verschlüsselt gespeichert. Audio wird unmittelbar nach der Verarbeitung automatisch gelöscht. Daten werden nicht für Modelltraining genutzt und sind für Mitarbeiter nicht zugänglich. Ein Auftragsverarbeitungsvertrag ist verfügbar.

Lokale Verarbeitung für maximale Vertraulichkeit

Der Private-Pro-Modus führt das Transkriptionsmodell vollständig auf Ihrem eigenen Computer mittels WebGPU aus. Audio verlässt Ihr Gerät niemals. Es ist technisch unmöglich für Scribeer oder Dritte, auf die Daten zuzugreifen. Nach einem einmaligen Modell-Download funktioniert es vollständig offline. Dies ist das Schutzniveau, das die strengsten ethischen Protokolle erfüllt.

DSGVO-Konformität auf einen Blick

Praktische Hinweise für Ihr Forschungsprotokoll

Wenn Sie Transkriptionssoftware in Ihr Forschungsprotokoll oder Ihren Ethikantrag aufnehmen möchten, sind folgende Punkte anzusprechen:

  1. Beschreiben Sie, welchen Verarbeitungsmodus Sie verwenden (EU-Cloud oder lokal) und die Begründung dafür.
  2. Verweisen Sie auf den Auftragsverarbeitungsvertrag des Anbieters.
  3. Dokumentieren Sie die Verschlüsselungs- und Löschmaßnahmen.
  4. Erläutern Sie, wie Transkripte vor der Analyse anonymisiert werden.
  5. Halten Sie fest, dass der Anbieter keinen Zugang zum Transkriptinhalt hat (bei lokaler Verarbeitung) oder dass der Zugang durch Verschlüsselung technisch ausgeschlossen ist (bei Cloud-Verarbeitung).

Was es kostet

Cloud-Transkription beginnt bei €5,99 für 90 Audiominuten. Für größere Forschungsprojekte sind Team-Abonnements zu einem fixen Monatssatz verfügbar. Lokale Verarbeitung über Private Pro kostet €29,99/Monat für unbegrenzte Transkription, mit einer Team-Variante für Forschungsgruppen.

Viele Universitäten erstatten Softwarekosten für die Forschung. Prüfen Sie, ob Ihre Fakultät oder Forschungsgruppe ein Budget für Transkriptionstools hat.

Beginnen Sie mit einem Pilotversuch

Transkribieren Sie ein Interview als Pilotversuch, bevor Sie Ihren gesamten Datensatz verarbeiten. Beurteilen Sie die Qualität, testen Sie den Editor und bringen Sie das Ergebnis als Beispielausgabe zu Ihrer Ethikkommission. Das spart spätere Diskussionen.


Selbst ausprobieren: scribeer.io – 50 kostenlose Minuten, keine Kreditkarte erforderlich.

Back to blog