Google führt KI-Musikgenerator Lyria 3 in Gemini ...

Worum geht’s?

Google hat sein aktuelles KI-Modell Lyria 3 in die Gemini-App eingebunden und bietet damit eine neue Funktion zur Generierung von Musik. Anwender können durch einfache Beschreibungen, hochgeladene Fotos oder Videoclips innerhalb weniger Sekunden eigene Musikstücke erstellen lassen. Die erzeugten Tracks haben eine Länge von 30 Sekunden und werden automatisch mit Liedtexten sowie passenden Coverbildern ausgestattet.

Das System erlaubt es, verschiedene musikalische Parameter wie Stilrichtung, Geschwindigkeit und Gesangsarrangements zu bestimmen. Die Texterstellung übernimmt das Modell eigenständig auf Basis der eingegebenen Informationen. Google betont dabei, dass die Technologie zur Förderung kreativer Ausdrucksformen gedacht ist und nicht zur Nachahmung existierender Künstler dienen soll.

Hintergrund & Einordnung

Lyria 3 ist Teil der multimodalen Gemini-Plattform, die verschiedene Medienformate wie Text, Bild, Video und Audio miteinander verknüpft. Das System analysiert die bereitgestellten Eingaben und wandelt sie in musikalische Kompositionen um. Auch visuelles Material kann als Inspirationsquelle dienen und wird in die Klangerzeugung einbezogen.

Zur Transparenz und Nachvollziehbarkeit versieht Google alle generierten Audiodateien mit einem sogenannten SynthID-Wasserzeichen. Damit lässt sich die Herkunft als KI-generierter Inhalt eindeutig identifizieren. Zusätzlich können Nutzer Audiodateien hochladen und prüfen lassen, ob diese mit Google-KI-Werkzeugen erstellt wurden. Diese Maßnahme soll zur Transparenz beitragen und Fragen des Urheberrechts adressieren.

Bei der Verwendung von Künstlernamen in den Eingaben wird das System diese lediglich als stilistische Orientierung interpretieren, ohne direkte Imitationen zu erzeugen. Die Verfügbarkeit der Funktion wird schrittweise ausgerollt und ist mittlerweile auch in Deutschland zugänglich. Die Limitierung auf 30 Sekunden Länge stellt dabei eine bewusste Beschränkung des Systems dar.

Was bedeutet das?

Kreative Hürden werden gesenkt: Auch Personen ohne musikalische Ausbildung können nun schnell eigene Soundtracks für Projekte, Videos oder soziale Medien erstellen.
Transparenz durch Kennzeichnung: Das SynthID-Wasserzeichen ermöglicht die Unterscheidung zwischen KI-generierten und von Menschen komponierten Werken, was für Rechteklärung und Authentizität relevant wird.
Neue Fragen für die Musikindustrie: Die Technologie könnte etablierte Produktionsprozesse verändern und wirft Fragen zum Stellenwert menschlicher Kreativität sowie zu Vergütungsmodellen für Künstler auf.
Multimodale Integration: Die Verknüpfung verschiedener Medienformate in Gemini zeigt die Richtung, in die sich KI-Assistenzsysteme entwickeln – weg von reiner Textverarbeitung hin zu umfassenden kreativen Werkzeugen.
Begrenzter Umfang: Die 30-Sekunden-Beschränkung deutet darauf hin, dass Google zunächst einen kontrollierten Einstieg in den Markt sucht und möglicherweise urheberrechtliche Risiken minimieren möchte.