KI-Update kompakt: KI-Kosten, Musikgenerator Udio, Grok-1.5 Vision, KI-Schadcode

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 7 Min.
Inhaltsverzeichnis

Die Kosten für das Training von führenden KI-Sprachmodellen werden in den nächsten Jahren drastisch ansteigen, erwartet Anthropic-CEO Dario Amodei.

Amodei rechnet damit, dass Top-KI-Modelle, die heute etwa 100 Millionen Dollar kosten, schon bald eine Milliarde und bis 2025/26 bis zu 10 Milliarden Dollar verschlingen werden. Laut Amodei könnten solche KI-Systeme in 2-5 Jahren so mächtig sein, dass sie nicht mehr von Menschen kontrolliert werden können. Eine Verlangsamung der Entwicklung hält er aus Sicherheitsgründen für kontraproduktiv. Um die Sicherheit der Systeme zu gewährleisten, müssten sie vielmehr weiter skaliert und erforscht werden. Nur so könnten potenzielle Gefahren frühzeitig erkannt und Gegenmaßnahmen entwickelt werden. Als mögliche Gefahren sieht der Anthropic-CEO u.a. den Einsatz von KI für Biowaffen oder staatliche Desinformationskampagnen.

Auf einer internen Risiko-Skala von 1 bis 4 ordnet er diese Szenarien bei Stufe 3 ein und glaubt, Gefahren dieser Stufe könnten schon dieses oder nächstes Jahr erreicht werden. Die höchste Gefahrenstufe 4 erwartet Amodei zwischen 2025 und 2028. Dann rechnet er mit KI-Systemen, die sich selbst replizieren und weiterentwickeln können, was völlig neue Kontrollfragen aufwerfen und existenzielle Risiken mit sich bringen würde.

Dario Amodei war mehrere Jahre als Forscher bei OpenAI tätig, u.a. für KI-Sicherheit verantwortlich, und leitete das Team, das GPT-2 und GPT-3 entwickelte. Gemeinsam mit seiner Schwester gründete er später Anthropic, um sich auch auf KI-Sicherheitsforschung zu fokussieren.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Nach Suno.ai erscheint mit Udio bereits die nächste Plattform zur massenhaften Erzeugung von Musik durch künstliche Intelligenz. Das Tool, das sich derzeit noch in der Betaphase befindet, generiert anhand kurzer Beschreibungen überzeugende Songs inklusive Gesang in verschiedenen Genres wie Alternative Rock oder Jazz.

Userinnen und User geben lediglich Stichworte zum gewünschten Stil ein, optional auch Songtexte in mehreren Sprachen. Daraus erzeugt die KI zwei Varianten des Songs mit Instrumentalpassagen und Gesang. Die Ergebnisse überraschen trotz gelegentlich mangelnder Soundqualität mit Kreativität und lebendiger Stereoabbildung.

Die technologische Entwicklung weckt jedoch auch Sorgen bei Musikschaffenden, die um ihre künstlerische Daseinsberechtigung fürchten. Udio betont dagegen, eng mit talentierten Künstlerinnen und Künstlern zusammenzuarbeiten. Das Ziel sei es, jedem Menschen das Erschaffen außergewöhnlicher Musik zu ermöglichen.

Elon Musks KI-Unternehmen xAI hat mit Grok-1.5 Vision sein erstes multimodales KI-Modell vorgestellt. Neben Textfähigkeiten kann Grok-1.5V auch visuelle Informationen wie Dokumente, Diagramme, Grafiken, Screenshots und Fotos verarbeiten. Es soll in Kürze für erste Tester und bestehende Grok-Nutzer verfügbar sein.

In verschiedenen Benchmarks ist Grok-1.5V konkurrenzfähig mit führenden multimodalen Modellen wie GPT-4 von OpenAI, Claude von Anthropic und Googles Gemini Pro. Es übertrifft seine Konkurrenten zudem im von xAI eingeführten Benchmark "RealWorldQA", der das räumliche Verständnis der realen Welt misst.

Für die Entwicklung nützlicher KI-Assistenten für die reale Welt ist es laut xAI unerlässlich, dass die Modelle die physische Welt verstehen. Das Unternehmen sieht die Weiterentwicklung multimodaler Verstehens- und Generierungsfähigkeiten als wichtige Schritte auf dem Weg zu einer nützlichen allgemeinen künstlichen Intelligenz (AGI). Im Mai will xAI angeblich Grok-2 auf den Markt bringen, das laut Musk GPT-4 übertreffen soll.

Der Arbeitsmarktservice Österreich veröffentlichte einen Chatbot namens "Berufsinfomat" zur Berufsberatung, der trotz hoher Kosten von 500.000 Euro mit gravierenden Mängeln zu kämpfen hat. Der Bot ist mit stereotypen Geschlechterklischees programmiert und empfiehlt Frauen Tätigkeiten in der Schönheitsbranche, während er Männern IT-Jobs vorschlägt. Auch die technische Ausgereiftheit lässt zu wünschen übrig, sodass die Verantwortlichen nachbessern mussten.

Grundsätzlich besteht die Hoffnung, durch KI-Einsatz dem Fachkräftemangel zu begegnen und Routineaufgaben zu delegieren. Allerdings ist fraglich, ob der Chatbot die AMS-Mitarbeiter tatsächlich entlasten kann, da sie weiterhin jede Aussage überprüfen müssen. Ein Effizienzgewinn ist somit zweifelhaft.

Der "Berufsinfomat" verdeutlicht exemplarisch, dass der KI-Einsatz einer sorgfältigen Kosten-Nutzen-Rechnung bedarf. Trotz des aktuellen Hypes sollten Erwartungen, Kosten und Nutzen realistisch bewertet werden. Nur weil etwas technisch machbar ist, muss es nicht automatisch sinnvoll sein.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Ideogram, ein KI-Bildgenerator, hat ein umfangreiches Update auf Version 1.0 veröffentlicht. Die Fehlerrate bei der Textdarstellung sank um 15 Prozent, während Fotorealismus und Bildkohärenz deutlich zulegten. Menschliche Bewerter bevorzugten die neuen Bilder in puncto Prompt-Ausrichtung, Konsistenz und Textqualität zu 30-50 Prozent gegenüber dem Vorgänger.

Neue Funktionen umfassen "Describe" zur automatischen Erstellung detaillierter Bildbeschreibungen als Prompts, negative Prompts zum Ausschluss unerwünschter Bildelemente sowie drei Rendering-Modi: "Fast" (5 Sek.), "Default" (12 Sek.) und "Quality" (20 Sek.). Letztere erlauben die Priorisierung von Geschwindigkeit oder Detailgrad.

Ideogram punktet weiterhin mit akkurater Prompt-Umsetzung und zuverlässiger Textdarstellung. Seit dem Beta-Launch im September 2023 verzeichnet der Dienst über 7 Millionen Nutzer und 600 Millionen generierte Bilder. Nach kostenloser Registrierung stehen täglich 25 Gratis-Prompts zur Verfügung, erweiterte Optionen erfordern ein Abo.

Die Gruppierung TA547 greift gezielt deutsche Firmen mit gefälschten Metro-Rechnungen an, um die Infostealer-Malware Rhadamanthys zu verbreiten. Experten von Proofpoint haben diese Kampagne analysiert und dabei festgestellt, dass Teile des Schadcodes offenbar mithilfe von KI-gestützten Sprachmodellen wie ChatGPT erstellt wurden.

Proofpoints Analyse zufolge nutzen die Angreifer glaubwürdige Absenderadressen, jedoch seit Langem verdächtige Betreffzeilen wie "Rechnung No: mit großer Nummer". Die betrügerischen Mails enthalten passwortgeschützte ZIP-Anhänge mit einer Verknüpfungsdatei. Diese startet ein Powershell-Skript, das die Malware herunterlädt und direkt im Speicher ausführt, ohne Spuren auf der Festplatte zu hinterlassen. Das Skript weist ungewöhnlich präzise Kommentare auf, was für eine Generierung durch KI-Modelle spricht.

TA547 agieren international als "Initial Access Broker" und haben schon verschiedene Schadprogramme verbreitet. Der Einsatz von KI zur Malware-Erstellung scheint sich unter Cyberkriminellen zunehmend auszubreiten. Sicherheitsexperten sehen darin eine besorgniserregende Entwicklung.

Die sächsische Justizministerin Katja Meier kündigte die Gründung eines Beirats für digitale Ethik an. Das siebenköpfige Expertengremium soll die Landesregierung zu Fragen der KI beraten und Empfehlungen aussprechen. Der Beirat wird zu Beginn der nächsten Legislaturperiode im Herbst seine Arbeit aufnehmen.

Ziel ist es, die Entwicklung vertrauenswürdiger KI-Systeme zu fördern, deren Datengrundlage nachvollziehbar ist und die weder Diskriminierung erlernen noch reproduzieren. Meier betonte, dass KI nicht die Kernaufgaben von Richtern und Staatsanwälten übernehmen könne.

Staatskanzleichef Oliver Schenk sieht in KI eine strategisch wichtige Rolle für Sachsen mit seiner starken Industrie und Wissenschaft. Der Einsatz von KI-Anwendungen soll in Zukunft in vielen Bereichen ausgeweitet werden, wobei neben exzellenter Technologie auch die Akzeptanz in der Bevölkerung gestärkt werden müsse. Eine Bitkom-Studie zeigt, dass viele Unternehmen in KI großes Potenzial sehen, aber noch zögerlich sind.

(igr)