Die Welt der KI-Inferenz und IT-Security liefert dieser Tage gleich mehrere bemerkenswerte Entwicklungen – von einem nostalgischen Experiment auf 40 Jahre alter Hardware bis hin zu wichtigen Klarstellungen rund um die tatsächliche Bedrohungslage durch Quantencomputer.
Transformer auf dem Commodore 64: Nostalgie trifft KI-Architektur
Wer dachte, moderne KI-Modelle seien zwingend an leistungsstarke GPUs gebunden, wird durch das Projekt Soul Player C64 eines Besseren belehrt. Ein Entwickler hat einen vollständigen Decoder-only-Transformer – die gleiche Grundarchitektur, die auch hinter ChatGPT, Claude und Gemini steckt – in handgeschriebenem 6502/6510-Assembler implementiert und auf einem unmodifizierten Commodore 64 zum Laufen gebracht. Der C64 arbeitet mit einem Takt von lediglich 1 MHz. Das Modell umfasst rund 25.000 Parameter, quantisiert auf int8, verteilt auf 2 Schichten mit 4 Attention-Heads, 32-dimensionalen Embeddings und 64 FFN-Hidden-Units. Die Generierungsgeschwindigkeit liegt bei etwa 60 Sekunden pro Token – kein Wert für produktive Nutzung, aber ein eindrucksvoller Beweis dafür, dass echte Multi-Head-Causal-Self-Attention, Softmax und RMSNorm auch auf jahrzehntealter Hardware prinzipiell funktionieren. Das gesamte Modell passt bequem auf eine einzige Floppy-Disk. Das Projekt ist vor allem als technische Demonstration und Lernprojekt wertvoll: Es zeigt, wie kompakt moderne Transformer-Architekturen im Kern tatsächlich sind.
207 Token pro Sekunde mit Qwen3.5 auf einer RTX 3090
Am anderen Ende des Leistungsspektrums demonstriert das Open-Source-Projekt LuceBox, was mit konsequenter Hardware-spezifischer Optimierung möglich ist. Das Team hat für die RTX 3090 – eine GPU aus dem Jahr 2020 – einen sogenannten Megakernel entwickelt, der alle 24 Schichten des hybriden DeltaNet/Attention-Modells Qwen 3.5-0.8B in einem einzigen CUDA-Dispatch abarbeitet. Das Ergebnis: 207 Token pro Sekunde beim größeren Qwen3.5-27B-Modell sowie eine Energieeffizienz von 1,87 tok/J beim kleineren 0.8B-Modell – damit erreicht man laut Projektbeschreibung die Effizienz von Apples aktueller Silicon-Generation bei doppeltem Durchsatz. Der Ansatz des Teams ist bewusst radikal: Statt auf bessere Hardware zu warten, wird die Software für jeden Chip von Grund auf neu geschrieben. Kernels, Speculative Decoding und Quantisierung werden konsequent auf das jeweilige Ziel-Silizium zugeschnitten. Das Projekt setzt damit einen klaren Kontrapunkt zur gängigen Praxis, universelle Frameworks wie llama.cpp zu nutzen.
Kimi Vendor Verifier: Vertrauen in KI-Inferenz-Anbieter absichern
Ein weiteres relevantes Projekt kommt vom KI-Unternehmen Moonshot AI: Der Kimi Vendor Verifier (KVV) adressiert ein bislang wenig beachtetes Problem im Open-Source-KI-Ökosystem. Mit der Veröffentlichung des Modells K2.6 hat das Team gleichzeitig ein Werkzeug open-sourcet, mit dem Nutzer überprüfen können, ob ein Inferenz-Anbieter ein Modell korrekt implementiert hat. Hintergrund: Nach der Veröffentlichung früherer Kimi-Modelle häuften sich Community-Berichte über anomale Benchmark-Ergebnisse bei Drittanbietern. Untersuchungen ergaben, dass ein erheblicher Teil dieser Fälle auf fehlerhafte Inferenz-Implementierungen zurückzuführen war. Der KVV ermöglicht es, die Korrektheit einer Implementierung anhand eines F1-Scores zu messen. Das Tool unterstreicht, dass Open-Sourcing eines Modells nur die halbe Miete ist – die andere Hälfte ist die Sicherstellung, dass das Modell überall korrekt läuft.
Quantencomputer: Kein Grund zur Panik bei symmetrischer Kryptografie
Ein wichtiger Beitrag zur Versachlichung der Quantencomputer-Debatte kommt aus der IT-Security-Szene. Weit verbreitet ist die Annahme, Quantencomputer würden die effektive Sicherheit symmetrischer Schlüssel halbieren – also aus einem 128-Bit-AES-Schlüssel effektiv einen 64-Bit-Schlüssel machen. Diese Einschätzung ist laut aktueller Analyse schlicht falsch. Grover's Algorithmus, der theoretisch symmetrische Verschlüsselung angreift, bietet in der Praxis keinen quadratischen Speedup, der eine Verdopplung der Schlüssellänge notwendig machen würde – insbesondere nicht unter realen Bedingungen mit parallelen Quantenoperationen und physikalischen Einschränkungen. Kein Compliance-Standard weltweit empfiehlt aktuell den Wechsel von 128-Bit- auf 256-Bit-Schlüssel als Reaktion auf Quantencomputer. Die eigentliche, dringende Aufgabe liegt woanders: Asymmetrische Kryptografie – also ECDH, RSA, ECDSA und EdDSA – ist durch Shor's Algorithmus tatsächlich gefährdet und muss durch Post-Quantum-Verfahren ersetzt werden. Ressourcen und Aufmerksamkeit sollten daher gezielt dort investiert werden, wo die reale Bedrohung liegt.
Zusammengenommen zeigen diese Entwicklungen, wie breit das Spektrum aktueller technischer Innovationen ist: von experimentellen Retro-Projekten über hochoptimierte Produktions-Software bis hin zu kritischer Infrastruktur-Sicherheit. Für Entwickler und IT-Verantwortliche lohnt es sich, alle vier Bereiche im Blick zu behalten.
Quellen: Hacker News