Version 1.0 / Stand: 10.06.2026

Dieser Leitfaden bietet eine Orientierung für öffentlichen Stellen in Baden-Württemberg zur datenschutzkonformen Nutzung von KI-gestützten Speech-to-Text-Systemen für die Protokollierung von Gemeinderatssitzungen (insbesondere des öffentlichen Teils). „KI-Transkription“ meint dabei die automatisierte Audioaufzeichnung, Transkription und Zusammenfassung des gesprochenen Wortes in Gemeinderatssitzungen. 

Dieser Leitfaden als PDF (ca. 1,8MB)

 

Datenschutzrechtliche Rahmenbedingungen nach GemO und LDSG BW[1]

Gesetzliche Grundlagen und der „Anker“ im Ortsrecht

Die Erstellung von Niederschriften ist nach § 38 Absatz 1 Gemeindeordnung (GemO) verpflichtend. Die Verarbeitung personenbezogener Daten zu diesem Zweck ist gemäß Artikel 6 Absatz 1 Buchstabe e Datenschutz-Grundverordnung (DS-GVO) i.Vm. § 4 Absatz 1 und § 3 a Landesdatenschutzgesetz (LDSG) zulässig.

Wie bei jeder Verarbeitung personenbezogener Daten sind die Vorgaben der DS-GVO, insbesondere Art. 5 (Grundsätze) und Art. 25 (Datenschutz durch Technikgestaltung), zu beachten. Bei der Planung des Einsatzes einer „KI-Transkription” bedeutet das vor allem (nicht abschließend):

  • Dokumentationspflichten hinsichtlich Funktionsweise und Einsatzkontext
  • Transparenzpflichten gegenüber Betroffenen
  • Anpassung des Verzeichnisses der Verarbeitungstätigkeiten
  • Keine biometrische Datenverarbeitung
  • Durchführung einer Schwellwertanalyse sowie ggf. einer Datenschutz-Folgenabschätzung (DS-FA) für die gesamte IT-Umgebung, insbesondere mit Fokus auf die Bewertung von Risiken automatisierter Verarbeitungssysteme und geeigneter technischer und organisatorischer Schutzmaßnahmen

 

Erforderlichkeit einer Regelung im Ortsrecht

Die automatisierte Audioaufzeichnung, Transkription und Zusammenfassung des gesprochenen Wortes stellen Eingriffe in das Recht auf informationelle Selbstbestimmung dar. Diese Eingriffe bedürfen einer hinreichend bestimmten normativen Grundlage.

In systematischer Anlehnung an die Regelungen zum Videostreaming (§ 37a GemO) ist daher eine explizite Regelung im Ortsrecht erforderlich. Die verantwortliche Stelle hat nach den kommunalrechtlichen Vorschriften zu prüfen, ob diese Regelung in einer Satzung oder der Geschäftsordnung des Gemeinderats zu treffen ist. Im Ortsrecht sind die einzelnen Verarbeitungsvorgänge aufzuführen sowie die wesentlichen technischen und organisatorischen Schutzmaßnahmen festzulegen.

Es handelt sich um die Regelung folgender Verarbeitungsvorgänge:

  1. Automatisierte Audioaufzeichnung
  2. Verwendung der Aufzeichnung zur Verschriftlichung (Transkription)
  3. Verwendung der transkribierten Daten zur Fertigung der Niederschrift
  4. Interne Speicherung der Audioaufzeichnung, der Transkription sowie des Entwurfs der Niederschrift
  5. Löschung der Tonbandaufzeichnung, der Transkription sowie des Entwurfs der Niederschrift

 

Wesentliche technischen und organisatorischen Schutzmaßnahmen (nicht abschließend):

  1. Integrität und Vertraulichkeit der verarbeiteten Daten
    • Eingeschränkte Zugriffsrechte (z.B. Schriftführer_in und Stellvertretung)
    • Regelung bei Einwendungen gegen die Niederschrift
    • ggf. Protokollierung von Zugriffen
    • Dauerhafte „menschliche Kontrolle“ der Zusammenfassung sowie mindestens stichprobenartige Kontrolle der Transkription sowie Dokumentation dieser Prüfung
    • Prozesse zur Geltendmachung von Betroffenenrechten, insbesondere dem Recht auf Berichtigung nach Art. 16 DS-GVO
  1. Löschkonzept
    • Festlegung einer Höchstspeicherdauer, bzw. unverzügliche Löschung der Audioaufzeichnung und des Transkripts nach finaler Verabschiedung der Niederschrift (§ 38 Abs. 2 GemO)
  1. Transparenz
    • Hinweis während der Sitzung, dass eine Audio-Aufzeichnung stattfindet (z.B. mündlich oder durch Lichtsignal)
    • Dokumentation der aufgezeichneten Zeitfenster im Sitzungsprotokoll
    • Erfüllung der Informationspflichten nach Art. 13 DS-GVO

 

 Infokasten

Rechtsgrundlage für den Einsatz KI-gestützter Transkriptionssoftware zur Fertigung von Niederschriften öffentlicher Gemeinderatssitzungen ist somit Art. 6 Abs. 1 UAbs. 1 Buchst. e DS-GVO i.V.m. § 4 Abs. 1 LDSG i.V.m. § 38 GemO i.V.m. § 3a LDSG i.V.m. einer Regelung im Ortsrecht.

 

Differenzierung der Sprecherrollen

Die datenschutzrechtliche Bewertung hängt maßgeblich von der Rolle der sprechenden Person ab. Es gilt für die Transkription:

1. Vorsitzende & Gemeinderäte

    • Handeln als Funktionsträger im öffentlichen Amt
    • zulässig nach o.g. Voraussetzungen und Rechtsgrundlage

2. Bedienstete der Verwaltung

    • Keine Mandatsträger
    • zulässig nach o.g. Voraussetzungen und Rechtsgrundlage soweit i.R.d. jeweiligen hoheitlichen Aufgabenerfüllung durch den_die Bedienstete_n erforderlich

3. Sachverständige und sonstige Dritte

    • Keine Mandatsträger, keine Beschäftigten
    • zulässig nach o.g. Voraussetzungen und Rechtsgrundlage

4. Bürger_innen

    • ✘ Ausschluss der Bürgerfragestunde
    • Die Bürgerfragestunde sowie sonstige Wortbeiträge von Einwohnern sind von der KI-gestützten Transkription strikt auszunehmen.
    • Begründung:
      • Keine Funktionsträgereigenschaft
      • Erhöhte Schutzbedürftigkeit
      • Fehlende spezifische gesetzliche Grundlage
      • Unverhältnismäßigkeit dieser automatisierten Verarbeitungen
    • Konsequenz:
      • Verpflichtende Deaktivierung der Transkription („Pause-Funktion“)
      • Nachweis und Erkennbarkeit der Deaktivierung (organisatorisch und/oder technisch), z.B. durch optische Kenntlichmachung durch ein rotes Lichtsignal, wenn Aufnahme läuft; akustisches Signal, wenn Aufzeichnung startet.

 

Biometrie und Art. 9 DS-GVO

Nach aktueller fachlicher Bewertung[2] stellt die KI-Transkription keine Verarbeitung biometrischer Daten i.S.d. Art. 9 DS-GVO dar, sofern folgende Bedingungen zugleich erfüllt sind:

  • Nutzung der Stimme ausschließlich zur Umwandlung in Text (kein eigener Zweck)
  • Keine Identifizierung anhand stimmlicher Merkmale
  • Keine Nutzung von Voice-Matching oder Referenzdatenbanken
  • Sprecherunterscheidung („Diarization“) erfolgt:
    • Ausschließlich temporär innerhalb der Sitzung
    • Ohne dauerhafte Profilbildung
    • Ohne Zuordnung zu konkreten Personen (keine Namensverknüpfung ohne Rechtsgrundlage)

Achtung: Bei nachträglicher biometrischer Identifizierung oder Profilbildung wäre Artikel 9 DS-GVO einschlägig und die o.g. Rechtsgrundlage alleine nicht mehr ausreichend.

 

Technische Systemanforderungen aus datenschutzrechtlicher Sicht

Für einen rechtmäßigen Einsatz sind neben den o.g. technischen und organisatorischen Maßnahmen die folgenden Mindeststandards einzuhalten:

  1. Datenverarbeitung
  • Keine Nutzung der Daten zu Trainingszwecken[3]
  • Verarbeitung vorzugsweise innerhalb der EU
  • ggf. Abschluss eines Auftragsverarbeitungsvertrags (Art. 28 DS-GVO)
  1. Systemarchitektur
  • Bevorzugt: On-Premise-Lösung oder abgeschottete Instanz
  • Bei Cloud: BSI IT-Grundschutz und BSI C5[4], insb. Verschlüsselung und Mandantentrennung

 

Beschäftigtendatenschutz und Personalsachen

Besondere datenschutzrechtliche Zurückhaltung ist geboten, wenn in öffentlichen und nichtöffentlichen Sitzungen Personalsachen oder sonstige beschäftigtenbezogene Sachverhalte angesprochen, beraten oder bewertet werden.[5]

Die KI-gestützte Transkription solcher Inhalte ist regelmäßig nicht nach den oben genannten Rechtsgrundlagen zur Erstellung der Sitzungsniederschrift mittels Transkription gedeckt. Da es um vertrauliche Informationen besonders geschützter Personen geht, vermag die mit dem KI-Einsatz einhergehende Erleichterung der Protokollierung die Aufzeichnung von letztlich für das Protokoll nicht relevanten Daten nicht zu rechtfertigen. Dies gilt insbesondere bei Angaben zu einzelnen Beschäftigten hinsichtlich Bewerbungsverfahren, dienstlichen Bewertungen, Konflikten, Disziplinarfragen, Gesundheitsdaten und sonstigen sensiblen Personalangelegenheiten.

Situation Vorgabe
Personalsache wird aufgerufen oder erkennbar angesprochen Tonaufnahme und KI-Transkription   stoppen
Beratung über Personalsache läuft Keine automatisierte Aufzeichnung oder Transkription
Beratung ist abgeschlossen Aufzeichnung kann wieder gestartet werden
Ergebnis für Niederschrift erforderlich KI-Transkription der Zusammenfassung des Ergebnisses der Beratung nur möglich, sofern dadurch keine zusätzlichen Risiken für die Sicherheit und Richtigkeit der Daten geschaffen werden, etwa durch Weiterleitung an Auftragsverarbeiter, Drittstaatentransfer, Speicherung in der Cloud oder Fehler der KI

 

Die Sitzungsleitung muss organisatorisch sicherstellen, dass entsprechende Tagesordnungspunkte oder Gesprächsverläufe rechtzeitig erkannt werden. Die Unterbrechung der Aufnahme sollte nachweisbar dokumentiert werden, etwa durch einen kurzen Vermerk im Protokoll.

Empfehlung:
Im Ortsrecht sollte festgelegt werden, dass die Sitzungsleitung bei Personalsachen verpflichtend die „Pause-Funktion“ auslöst und erst nach Abschluss des Beratungsteils wieder aktiviert.

 

Einsatz in nicht-öffentlichen Sitzungen

In nicht-öffentlichen Sitzungen können gegebenenfalls besondere Kategorien personenbezogener Daten (i.S.v. Art. 9 Abs. 1 DS-GVO) verarbeitet werden, die dem Kernbereich des Persönlichkeitsschutzes oder strikten Geheimhaltungspflichten unterliegen (z.B. Gesundheitsdaten). Die Verarbeitung dieser Daten bedarf einer eigenen Grundlage nach Art. 9 Abs. 2 DS-GVO und erfordert in der Regel die Durchführung einer DS-FA. Die Ausnahme nach Art. 9 Abs. 2 DS-GVO muss gerade auch den Einsatz von KI-Anwendungen zur Verarbeitung umfassen, wobei die Erforderlichkeit der Aufnahme der Daten in das Protokoll sowie die Einhaltung von technischen und organisatorischen Maßnahmen zur Sicherheit der Daten besonders streng zu prüfen ist. Gegebenenfalls muss die „Pause-Funktion“ aktiviert werden, wenn entsprechende Angelegenheiten besprochen werden.

 

Verfahrensanforderungen

Vor Einführung eines Systems sind zwingend:

  1. Schwellwertanalyse und ggf. Durchführung einer DS-FA für die gesamte IT-Umgebung
  2. Beteiligung der_des Datenschutzbeauftragten
  3. Dokumentation der Systementscheidung
  4. Schulung der Sitzungsleitung (insbesondere „Pause-Funktion“)
  5. Festlegung klarer Verantwortlichkeiten

 

Zusammenfassung der Machbarkeit

Bereich Status Voraussetzung
Öffentliche Sitzung Machbar Regelung im Ortsrecht; TOMs
Bürgerbeiträge Unzulässig KI-Transkription der Fragezusammenfassung und Ergebnis durch Sitzungsleitung möglich.
Keine Aufnahme personenbezogener Daten der Bürger_Innen.
Personalsachen/Beschäftigtendaten Unzulässig Aufnahme stoppen, KI-Transkription des Ergebnisses möglich
Nicht-öffentliche Sitzung gesonderte Prüfung erforderlich Gesonderte Prüfung bzgl. Art. 9-Daten, gesonderte Rechtsgrundlage nach Art. 9 Abs. 2 DS-GVO für deren Verarbeitung erforderlich

 

Fazit

Der Einsatz von KI-Transkriptionssystemen zur Fertigung der Niederschrift in Gemeinderatssitzungen ist unter klaren rechtlichen und technischen Rahmenbedingungen zulässig:

  • unter strikter Beachtung der Rollen der Beteiligten und
  • bei konsequenter technischer Absicherung.

Die zentrale Voraussetzung ist eine normative Verankerung im Ortsrecht sowie eine risikoadäquate Umsetzung.

 

 Infokasten

Rechtsgrundlage für den Einsatz KI-gestützter Transkriptionssoftware zur Fertigung von Niederschriften öffentlicher Gemeinderatssitzungen ist somit Art. 6 Abs. 1 UAbs. 1 Buchst. e DS-GVO i.V.m. § 4 Abs. 1 LDSG i.V.m. § 38 GemO i.V.m. § 3a LDSG i.V.m. einer Regelung im Ortsrecht.

 


Fußnoten

[1] Das Papier versteht sich vorbehaltlich künftiger Aussagen der DSK oder des EDSA zum Thema, soweit diese auf die Situation im Landesrecht übertragbar sind.

[2] 15. Tätigkeitsbericht BayLDA 2025, S. 56ff., abrufbar unter https://www.lda.bayern.de/media/baylda_report_15.pdf.

[3] Möglich wäre dies nur im Anwendungsbereich von § 11a LDSG, was jedoch hier nicht der Regelfall sein dürfte.

[4] https://www.bsi.bund.de/SharedDocs/Downloads/DE/BSI/CloudComputing/Anforderungskatalog/2026/C5_2026_en.pdf.

[5] Hier ist der Einsatz von Auftragsverarbeitern besonders kritisch, insbesondere der Einsatz privater (Unter-)Auftragsverarbeiter dürfte aufgrund der hohen Anforderungen des § 85a LBG nicht möglich sein.

 

Dieser Leitfaden als PDF (ca. 1,8MB)