Google hat eine KI, die Textaufforderungen in Musik umwandeln kann

Google hat eine KI, die Textaufforderungen in Musik umwandeln kann

Wenn die Kontroverse um KI-generierte Kunst nicht ausreicht, hat Google MusicLM entwickelt, ein System, das Musik aus Textbeschreibungen, Bildern und einfachen Melodien generiert. Wenn Sie denken, dass es zu gut klingt, um wahr zu sein, lesen Sie weiter, um mehr zu erfahren.

Google hat eine KI namens MusicLM

Während Google MusicLM noch nicht offiziell veröffentlicht hat, macht das generative KI-System bereits Schlagzeilen. Google beschreibt in seinem Research Abstract, in dem es Beispiele dafür gibt, was die Technologie leisten kann, sie als ein Modell, das „High-Fidelity-Musik aus Textbeschreibungen“ generiert.

Die Software, die mit über 280.000 Stunden Musik trainiert wurde, stellt verschiedene Musikszenarien in verschiedenen Formaten bereit. Dazu gehören Audio Generation From Rich Captions , Story Mode und Painting Caption Conditioning – ein Gemälde gepaart mit einer Beschreibung davon (Google hat ein Beispiel des KI-generierten Audios beigefügt).

Zwei Gemälde mit Textbeschreibungen an der Seite und von KI generiertem Audio

Google ist nicht das erste Unternehmen, das KI für die Musikproduktion einsetzt. Zum Beispiel verfügt LALAL.AI über einen Cassiopeia-Algorithmus, der ein künstliches neuronales Netzwerk verwendet, das Gesang und Instrumental trennt, ohne dass eine manuelle Ausführung durch einen Ingenieur erforderlich ist. Google hat jedoch einen gewaltigen Sprung nach vorne gemacht, indem es ein System entwickelt hat, das Musik allein aus Text erzeugen kann.

Google wird MusicLM nicht veröffentlichen: Hier ist der Grund

Unglücklicherweise für Google ist es unwahrscheinlich, dass MusicLM veröffentlicht wird. Der offensichtlichste Grund ist, dass es gegen urheberrechtlich geschützte Musik verstößt. Als Google damit Tests durchführte, fanden sie heraus, dass mindestens 1 % jedes Songs, den das System ausspuckte, mit der Musik identisch war, mit der es die Software trainierte.

Diese Statistik mag niedrig erscheinen, aber sie bedeutet eine Katastrophe, und Google ist nicht bereit, in irgendwelche Klagen verwickelt zu werden.

Darüber hinaus mag die Technologie in ihrem Bereich beispiellos sein, aber es gibt noch Elemente, die verfeinert werden müssen; Die Vocals klingen fehlerhaft und verzerrt, und die Sprache ähnelt Simlish mehr als jeder existierenden Sprache in der realen Welt.

Google sollte MusicLM überdenken

MusicLM könnte Musikern und Nicht-Musikern gleichermaßen eine große Hilfe sein, aber wenn Google keine umfassenden Verbesserungen vornimmt, sollte es nicht live gehen. Wenn das System freigegeben werden soll, müssen mindestens zwei große Änderungen vorgenommen werden.

Erstens muss Google einen Weg finden, MusicLM ethischer zu gestalten. Shutterstock hat die KI-Kunsterzeugung ethischer und für Benutzer zugänglicher gemacht, vielleicht könnte Google nachziehen. Wenn Google MusicLM mit lizenzierfertiger Musik trainieren und die Künstler, die zum System beitragen, entlohnen würde, wäre eine Veröffentlichung möglicherweise machbar.

Zweitens muss Google den Gesang verbessern. Wenn Google keinen Weg um die unrealistischen Vocals und das Kauderwelsch findet, sollte es ganz darauf verzichten. Software wie Vocaloid wäre der Standard, und wenn sie nicht die gleiche Qualität erfüllt, ist die Funktion nutzlos.

Nicht heute, Google

Es ist offensichtlich, dass es bei MusicLM viele Komplikationen gibt, und es wäre der falsche Schritt, die Software so zu veröffentlichen, wie sie ist. Aber die Technologie schreitet im Handumdrehen voran, daher besteht immer die Möglichkeit, dass etwas Besseres kommt – nur nicht heute.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert