ZAIOS.NETBlogSoftware
27. März 2026 2 Min. Lesezeit

GitHub trainiert KI auf privaten Repos – Opt-out bis 24. April

GitHub aktiviert standardmäßig KI-Training auf privaten Repositories. Nutzer müssen bis zum 24. April aktiv widersprechen.

Ein stiller Paukenschlag in der Entwickler-Community: GitHub hat seine Nutzungsbedingungen so angepasst, dass private Repositories standardmäßig für das Training von KI-Modellen – konkret für GitHub Copilot – herangezogen werden dürfen. Wer das nicht möchte, muss bis zum 24. April 2025 aktiv widersprechen. Die entsprechende Einstellung findet sich in den Copilot-Einstellungen unter github.com/settings/copilot/features.

Opt-out statt Opt-in: Ein bewusstes Design-Entscheidung

Was die Entwickler-Community besonders aufgebracht hat, ist nicht unbedingt das Training an sich, sondern die Methodik dahinter. Anstatt Nutzer aktiv um Erlaubnis zu bitten – also ein klassisches Opt-in-Verfahren – hat GitHub den umgekehrten Weg gewählt: Wer schweigt, stimmt zu. Dieses Vorgehen ist in der Tech-Industrie leider keine Seltenheit, wird aber insbesondere bei sensiblen Daten wie privatem Quellcode als besonders problematisch wahrgenommen. Auf Hacker News erreichte die Diskussion darüber über 600 Punkte und fast 300 Kommentare – ein deutliches Zeichen für die Brisanz des Themas.

Privater Code ist oft hochsensibel

Private Repositories auf GitHub enthalten häufig proprietären Unternehmens-Code, interne Infrastruktur-Skripte, API-Schlüssel in Konfigurationsdateien oder frühe Prototypen von Produkten, die noch nicht öffentlich sind. Dass solche Daten ohne explizite Zustimmung in KI-Trainingspipelines fließen könnten, wirft erhebliche Fragen zu geistigem Eigentum, Datenschutz und Geschäftsgeheimnissen auf. Gerade für Unternehmen, die GitHub Enterprise oder kostenpflichtige Tarife nutzen, dürfte dies rechtliche Konsequenzen haben.

Ein vorhersehbarer Schritt – mit Ansage

Technikexperten weisen darauf hin, dass diese Entwicklung absehbar war. Schon seit Jahren gilt als Faustregel: Wer seine Daten unverschlüsselt bei einem Drittanbieter lagert, muss damit rechnen, dass dieser Anbieter irgendwann seine Nutzungsbedingungen anpasst, um diese Daten für KI-Training zu nutzen. Die wirtschaftlichen Anreize sind schlicht zu stark. GitHub gehört seit 2018 zu Microsoft, das mit Azure OpenAI und eben GitHub Copilot massiv in KI-Infrastruktur investiert. Copilot ist eines der meistgenutzten KI-Tools für Entwickler weltweit – und bessere Trainingsdaten bedeuten ein besseres Produkt.

Was Nutzer jetzt tun sollten

Wer seine privaten Repositories vom KI-Training ausschließen möchte, sollte unverzüglich handeln:

  • Die Einstellungsseite github.com/settings/copilot/features aufrufen
  • Die entsprechende Option zum Training auf privaten Repositories deaktivieren
  • Organisationen sollten prüfen, ob auch auf Organisations-Ebene entsprechende Einstellungen vorgenommen werden müssen
  • Frist beachten: 24. April 2025

Branchentrend mit Signalwirkung

Der Vorfall reiht sich in einen breiteren Trend ein: Immer mehr Plattformen – von sozialen Netzwerken bis hin zu Cloud-Diensten – nutzen nutzergenerierte Inhalte für KI-Training. Ob Adobe, Zoom oder nun GitHub: Die Reaktionen der Nutzer sind jedes Mal ähnlich – Empörung, gefolgt von hastigen Klarstellungen der Unternehmen. Das grundlegende Problem bleibt jedoch bestehen: Solange Daten nicht Ende-zu-Ende verschlüsselt sind und Unternehmen wirtschaftliche Anreize haben, diese Daten zu nutzen, werden solche Situationen wiederkehren. Für Entwickler und Unternehmen bedeutet das: Die Frage, wo und wie Code gespeichert wird, ist längst auch eine strategische Datenschutzentscheidung.

Quellen: Hacker News

softwareaiki