Die Untersuchung, die Anfang dieser Woche von Wired veröffentlicht wurde, ergab, dass über 170.000 Videos von bekannten Content Creators Teil eines Datensatzes waren, der zur Schulung von KI-Modellen verwendet wurde. Apple nutzte diesen Datensatz spezifisch zur Entwicklung seiner Open-Source-Modelle namens OpenELM, die im April veröffentlicht wurden.
- Apple hat klargestellt, dass sein OpenELM-Modell keine AI-Funktionen des Unternehmens unterstützt.
- OpenELM wurde nur zu Forschungszwecken entwickelt und nicht für kommerzielle Anwendungen.
- Die verwendeten Youtube-Daten fließen nicht in Apple-Intelligence-Modelle ein.
Nun hat Apple gegenüber 9to5Mac klargestellt, dass OpenELM keine seiner KI- oder Machine-Learning-Funktionen unterstützt, einschließlich des Apple Intelligence Systems. Apple betonte, dass OpenELM ausschließlich zu Forschungszwecken erstellt wurde, um die Entwicklung von Open-Source-Sprachmodellen zu fördern.
Bei der Veröffentlichung von OpenELM auf dem Hugging Face Hub, einer Plattform zur gemeinsamen Nutzung von KI-Code, beschrieben Apple-Forschende das Modell als ein „hochmodernes offenes Sprachmodell“, das dazu gedacht sei, „die offene Forschungsgemeinschaft zu stärken und zu bereichern“. Das Modell ist auch über die Apple-Machine-Learning Research-Website verfügbar. Apple hat zudem erklärt, dass es keine Pläne gibt, neue Versionen des OpenELM-Modells zu entwickeln.
Das Unternehmen unterstrich, dass OpenELM nicht in Apple Intelligence integriert ist und der „YouTube Subtitles“-Datensatz keine seiner kommerziellen KI-Funktionen unterstützt. Apple wiederholte seine Erklärung, dass Apple Intelligence-Modelle mit „lizenzierten Daten, einschließlich Daten, die zur Verbesserung bestimmter Funktionen ausgewählt wurden, sowie öffentlich zugänglichen Daten, die von unserem Webcrawler gesammelt wurden“, trainiert werden.
Der Wired-Bericht beschreibt ausführlich, wie Unternehmen, darunter Apple, Anthropic und NVIDIA, den „YouTube Subtitles“-Datensatz für das Training von KI-Modellen genutzt haben. Dieser Datensatz ist Teil einer größeren Sammlung namens „The Pile“, die von der gemeinnützigen Organisation EleutherAI zusammengestellt wurde.
OpenELM ist ein Open-Source Sprachmodell von Apple, das ausschließlich zu Forschungszwecken entwickelt wurde. Es gehört nicht zu den kommerziellen Produkten des Unternehmens. Ziel war es, die Forschungsgemeinschaft zu unterstützen und weiterzubringen.