MM1

Apple zeigt neues KI-Training für Text und Bilder

Apple hat Forschungsergebnisse veröffentlicht. Sie beschreiben eine Methode, wie Large Language Models (LLM) anhand von Bildern und Texten trainiert werden können. Damit soll eine künstliche Intelligenz besser aus der echten Welt lernen und bestimmte Aufgaben mit hoher Präzision erledigen. Das Ganze hat Apple „MM1“ getauft.

Von   Uhr
2 Minuten Lesezeit

Hinter den Kulissen arbeitet Apple am nächsten großen Ziel. Es soll darum gehen, eine künstliche Intelligenz aufzubauen. Die ersten Ergebnisse werden auf der WWDC erwartet und sollen in iOS 18 einfließen. Wie bestimmte Aufgaben erledigt werden können, hat das Unternehmen jetzt in einem Forschungsbericht ausgebreitet.

„MM1“ soll neue Standards setzen

In dem Dokument geht es darum, intelligente und flexible KI-Systeme auf die Beine zu stellen. Dabei wird die künstliche Intelligenz mit Bildern und Texten trainiert. Es wird aufgezeigt, dass eine Kombination aus Bildern samt Bild-Unterschriften sowie Texten, die Bilder beschreiben, für die initiale Zündung sorgen. Mit dabei sind auch Dokumente, die nur aus Texten bestehen.

Apple verspricht sich damit eine künstliche Intelligenz, die verschiedene Aufgaben effizient und präzise lösen kann. Damit sollen in dem Bereich neue Standards gesetzt werden. Das betrifft etwa die Generierung von Bild-Unterschriften, das Beantworten visueller Fragen und das Interagieren mit natürlicher Sprache. Besonders letzteres klingt stark nach dem, was das Unternehmen gebrauchen könnte, um Siri ein wohlverdientes (und längst überfälliges) Upgrade zu gönnen.

Mehrere Stufen

Weiterhin erklärt das Dokument, dass „MM1“ in der Lage ist, anhand des aktuellen Kontext zu lernen und Probleme in mehreren Stufen zu lösen. Es wäre also möglich, dass sich das Modell daran erinnert, was kurz zuvor besprochen wurde und entsprechend darauf reagiert.

Ob und besonders wann wir Ergebnisse aus dieser Forschung sehen werden, ist offen. Apple hat sich einem Bericht zufolge bei Google und OpenAI umgesehen, wie Gemini und ChatGPT lizenziert werden könnten. Es wäre denkbar, dass Apple die bereits vorhandenen Lösungen übergangsweise verwendet, bis die eignen Modelle marktreif sind. Das Forschungsdokument zeigt aber, dass auch in Cupertino nach eigenen Methoden gesucht wird.

Diskutiere mit!

Hier kannst du den Artikel "Apple zeigt neues KI-Training für Text und Bilder" kommentieren. Melde dich einfach mit deinem maclife.de-Account an oder fülle die unten stehenden Felder aus.

Die Kommentare für diesen Artikel sind geschlossen.