DiffusionGemma: Google beschleunigt Gemma 4 mit Technik zur Bilderzeugung
Google arbeitet mit DiffusionGemma an einem LLM-Ansatz, der statt streng sequenzieller Token-Erzeugung viele Tokens parallel generiert. Die Diffusionstechnik kann lokale Hardware besser auslasten und damit schneller sein, geht aber offenbar zulasten der Genauigkeit.