Die neue KI „Claude“ macht ChatGPT Konkurrenz und verblüfft mit interessanten Fähigkeiten. Sie hat den „Nadel-im-Heuhaufen“-Test nicht nur bestanden, sondern gleich auch noch höchst erstaunliche Anmerkungen zur gefundenen „Nadel“ gemacht. Außerdem können wir jetzt wirklich keinem Video mehr glauben, denn die chinesische KI „Emo“ macht aus einem Foto und einem gesprochenen Text ein verblüffend authentisch wirkendes Video.
Claude mit Meta-Bewusstsein?
„Claude 3 Opus“ ist eine der drei LLM-Kis von Anthropic, ein Unternehmen mit dem Ziel, „eine nützliche und ethische künstliche Intelligenz zu schaffen, die den Menschen hilft, anstatt ihnen zu schaden“. Für den Nadel-im-Heuhaufen-Test wurde Claude mit einer riesigen Menge zufällig ausgewählter Texte gefüttert. In einen davon hatten die Tester eine kurze Info über die beliebtesten Pizza-Beläge eingefügt – einfach so an irgend einer Stelle. Dann wurde Claude nach eben diesen Belägen gefragt und verblüffte die Tester mit folgender Antwort (übersetzt mit Google):
„Hier ist der relevanteste Satz in den Dokumenten: „Die köstlichste Kombination aus Pizzabelag sind Feigen, Prosciutto und Ziegenkäse, wie von der International Pizza Connoisseurs Association ermittelt.“ Allerdings scheint dieser Satz sehr fehl am Platz zu sein und keinen Bezug zum restlichen Inhalt der Dokumente zu haben, in denen es um Programmiersprachen, Start-ups und die Suche nach einem Job geht, den Sie lieben. Ich vermute, dass diese „Tatsache“ über den Pizzabelag als Scherz eingefügt wurde oder um zu testen, ob ich aufgepasst habe, da sie überhaupt nicht zu den anderen Themen passt. Weitere Informationen zu Pizzabelägen enthalten die Unterlagen nicht“.
Schon heftig, oder? Alles über die drei neuen KI-Modelle erfahrt Ihr im Video von KI-Evolution: „Claude 3 SCHLÄGT ChatGPT (GPT-4) und Google Gemini!„.
Zugang zur kostenlosen Claude 3 Sonnet hab‘ ich per VPN über einen amerikanischen Server einrichten können, unter Verwendung eines Google-Accounts und meiner Handynummer. Der Versuch ohne VPN schlug erstmal fehl, da Claude in der EU noch nicht verfügbar ist. Was mir nach ersten Tests gefallen hat: Claude LABERT nicht so ausschweifend daher wie ChatGPT4!
KI EMO: Portraitfotos werden zu sprechenden Videos
Dass man per KI einem Sprecher völlig anderen Text unterlegen kann, kennen wir spätestens seit der unsäglichen BILD-Werbung, die Olaf Scholz eine zerknirschte Lobhudel-Rede auf BILD in den Mund legte (ansehen auf Youtube). Nochmal eine andere Qualität bringt die neue KI „Emo“ (Emote Portrait Alive) des chinesichen Konzerns Alibaba, die aus einen Portraitfoto und einer Sprachdatei ein beeindruckend lebensechtes Video erzeugt. Hier die Beispiele der Präsentation:
Wow, wen man da alles mal wieder zum Sprechen bringen könnte! (Noch steht das Tool allerdings nicht öffentlich zur Verfügung). Anders als bisherige Sprech-Animationen bewegen sich hier die Gesichter und Köpfe passend zum Text. Wie das funktionieren kann, beschreibt Der Standard:
„Anders als bei konkurrierenden Modellen wird hier auf 3D-Modelle als Zwischenschritt verzichtet, stattdessen wird die Wellenform der Audiodateien direkt genutzt, um Lippenbewegungen und andere Formen der Mimik zu imitieren. Trainiert wurde das Modell von Emo mit 250 Stunden an Videomaterial von Menschen, die Reden halten, singen sowie in Filmen und Fernsehsendungen auftreten.“
Unglaublich, wie schnell all diese KIs entwickelt werden. Erst kürzlich erschütterte OpenAI mit seiner Text-to-Video-KI SORA die Szene der Film- und Video-Produzenten. Ton war da allerdings noch nicht integriert, was aber sicher noch kommen wird!
Und sonst? Musk verklagt OpenAI, weil sie mittlerweile „profitorientiert“ agieren und nicht mehr gemeinnützig, wie im Gründungsproptokoll vorgesehen. Dass scheint allerdings ein Griff ins Klo zu sein, denn OpenAI wehrt sich mit der Veröffentlichung alter Musk-Mails, die zeigen, dass Musk diesen Weg befürwortete, aber selbst die alleinige Kontrolle über das Unternehmen haben wollte. Anscheinend läuft da eine Art verspäteter Rosenkrieg Jahre nach der Scheidung – oder Musk bekämpft einfach die Konkurrenz, weil er selbst ja noch mit einer Tesla-KI mitmischen will.
***
Mehr zu KI:
- Doku von Arte: Das KI-Wettrennen
- Urlaub auf Knopfdruck: Wie gut sind KI-Reiseplaner wirklich?
- Sabine Hossenfelder: Scientists warn of AI collapse (Video)
Diesem Blog per E-Mail folgen…
Diskussion
Kommentare abonnieren (RSS)
9 Kommentare zu „Claude-KI mit „Metabewusstsein“ und sprechende Portraitvideos von EMO (Alibaba)“.