Als Standard qualitativer Forschung gilt, verbale und visuelle Daten – wie etwa Audio- und Videoaufzeichnungen von Interviews, Gruppendiskussionen, Feldgesprächen und Interaktionen – schriftlich zu fixieren, um sie für die spätere Analyse nutzen zu können. Von den Aufnahmen werden hierzu Abschriften, sogenannte Transkripte, erstellt. Bei der Transkription findet eine Transformation der ursprünglichen Informationen statt, denn bei Transkripten handelt es sich um Artefakte, d. h., sie sind lesbare Fixierungen in Form statischer Texte. Insofern sollte im Auswertungsprozess auch immer wieder auf die Audio- bzw. Videoaufzeichnungen zurückgegriffen werden. Dabei darf allerdings nicht übersehen werden, dass diese ihrerseits Fixierungen von teils sehr lebendigen Interaktionen (inklusive aller mimischen, gestischen und sprachlichen Ausdrucksformen) in bestimmten Settings (samt ihrer physischen, atmosphärischen, olfaktorischen etc. Besonderheiten) darstellen.
Für die Verschriftlichung liegen verschiedene – und verschieden elaborierte – Transkriptionsvorschläge vor. Kowal und O’Connell[1] unterscheiden vier Formen der Verschriftlichung:
Eine an Schriftsprache orientierte „einfachere“ Transkription (Standardorthografie oder literarische Umschrift) ist zu empfehlen, wenn die Auswertung insbesondere darauf abzielt, was gesagt wurde (manifester Inhalt). Ist hingegen von Interesse, wie etwas gesagt wurde (z. B. kommunikativ-interaktionale Aspekte) oder warum etwas gesagt wurde (latenter Sinn), sind komplexere Transkriptionen (Eye Dialect oder phonetische Umschrift) vorzunehmen. Dazu bieten sich etwa die Vorschläge spezieller Transkriptionssysteme wie GAT[2] oder HIAT[3] an.
Im Zuge einer Transkription sind mehrere Entscheidungen zu treffen. Die Entscheidung, was in welchem Verschriftungsformat transkribiert wird, hängt von der Forschungsfrage ab. Folgende Merkmalsbereiche müssen hierbei berücksichtigt werden:
Neben inhaltlichen sollten auch pragmatische Abwägungen getroffen werden. Die Dauer für eine Transkription hängt von der Art der Datenerhebung (bspw. sind Abschriften von Gruppendiskussionen zeitintensiver als von Einzelinterviews), der Aufnahmequalität, dem gewählten Transkriptionsformat sowie der Tippgeschwindigkeit ab und variiert ca. zwischen 1 : 4 bis 1 : 10, d. h., für eine Stunde Audiomitschnitt eines Interviews sind vier bis zehn Stunden Transkriptionszeit zu veranschlagen. Für die Transkription videografierter Daten ist je nach Ansprüchlichkeit der Transformation von Bild- und Sprachinformation ungleich mehr Zeit einzuplanen. Generell empfiehlt es sich, für die Transkription auf speziell hierfür entwickelte Software zurückzugreifen; für Audio-Daten steht z. B. das Programm „f4transkript“[4] zur Verfügung, für videografierte Daten z. B. „Feldpartitur“[5], „Transana“[6] oder „ELAN“[7].; bei visuellem Material (Bilder/Filme) wird aber z. T. auch dafür votiert, dies direkt – also ohne zusätzliche Übersetzung/Beschreibung – als Grundlage für die Auswertung zu nutzen.
Mittlerweile gibt es auch eine Vielzahl von Spracherkennungssoftware, die das Transkribieren unterstützt, wobei die Resultate jedoch nicht immer überzeugen können[8], gleichwohl zukünftig hier Besserungen zu erwarten sind.[9] Zudem hat sich ein Markt mit Schreibbüros speziell für das Erstellen von Transkripten etabliert. Ungeachtet dessen empfiehlt sich, die Verschriftlichung der Aufnahmen – vor allem im Rahmen von Qualifikationsarbeiten – als Forschende zumindest teilweise selbst zu übernehmen. Dies erhöht die Vertrautheit mit dem Material und bereitet sehr gut auf die Phase der Auswertung vor.
Bei der Transkription von qualitativen Daten ist auch auf eine präzise Anonymisierung bzw. Pseudonymisierung personenbezogener Daten zu achten. Genau zu reflektieren ist hier, was personenbezogene Daten meint. Wir verstehen hierunter Daten, die eine Identifizierung ermöglichen. Hierzu zählen nicht nur Angaben zu Personen, Institutionen, Orten oder Zeitpunkten, sondern auch Daten, die in Kombination miteinander einen Rückschluss auf die Person zulassen und ebenso sehr spezifische Ereignisse oder individuelle Sprech- und Artikulationsweisen (personenbeziehbare Daten). Je nach Forschungsfeld ist daher immer auf ein Neues abzuwägen, welche Eigenarten, Charakteristika, Funktionen etc. zu Identifizierungen führen können. Zusätzlich kann es angezeigt sein, die Audio-/Videodaten entsprechend zu bearbeiten.[10]
Kowal, Sabine & O’Connell, Daniel C. (2012). Zur Transkription von Gesprächen. In Uwe Flick, Ernst von Kardorff & Ines Steinke (Hrsg.), Qualitative Forschung. Ein Handbuch (9. Aufl., S. 437–447). Reinbek: Rowohlt.
Dresing, Thorsten & Pehl, Thorsten (2010). Transkription. In Günter Mey & Katja Mruck (Hrsg.), Handbuch Qualitative Forschung in der Psychologie (S. 723–733). Wiesbaden: VS.
Dittmar, Norbert (2009). Transkription. Ein Leitfaden mit Aufgaben für Studenten, Forscher und Laien (3. Aufl.). Wiesbaden: VS.
Dresing, Thorsten & Pehl, Thorsten (2018). Praxisbuch Interview, Transkription & Analyse. Anleitungen und Regelsysteme für qualitativ Forschende (8. Aufl.). Marburg, https://www.audiotranskription.de/workshops#buch.
[1] Kowal, Sabine & O’Connell, Daniel C. (2012). Zur Transkription von Gesprächen. In Uwe Flick, Ernst von Kardorff & Ines Steinke (Hrsg.), Qualitative Forschung. Ein Handbuch (9. Aufl., S. 437–447). Reinbek: Rowohlt.
[2] http://agd.ids-mannheim.de/gat.shtml
[3] http://www.exmaralda.org/hiat/index.html
[4] http://www.audiotranskription.de/f4.htm
[5] http://www.feldpartitur.de
[7] https://tla.mpi.nl/tools/tla-tools/elan/
[8] Pehl, Thorsten & Lombardo, Claudia (2008). Schnellere Transkription durch Spracherkennung? [35 Abs.]. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 9 (2), Art. 17, http://nbn-resolving.de/urn:nbn:de:0114-fqs0802174.
[9] https://www.audiotranskription.de/Spracherkennung.
[10] Pätzold, Henning (2005). Sekundäranalyse von Audiodaten. Technische Verfahren zur faktischen Anonymisierung und Verfremdung. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 6(1), Art. 24, http://nbn-resolving.de/urn:nbn:de:0114-fqs0501249.