Google hat gerade Gemini vorgestellt, die erste multimodale KI, die menschliche Experten bei der MMLU mit einer Wertung über 90% übertroffen hat. Gemini ist darauf ausgelegt, direkt in Google-Apps integriert zu werden und ist ein Konkurrent zum GPT-4 mit drei verschiedenen Modellen - Ultra, Pro und Nano.
Gemini’s Fähigkeit, Bilder in Echtzeit zu verarbeiten und zu sprechen, festigt seine multimodale Funktionalität. Zu den fortschrittlichen Funktionen gehören anspruchsvolles Denken, Multimodalität und fortschreitende Codierung, was es weit überlegen in Mathematik und Kodierung im Vergleich zum ChatGPT (GPT-4) Modell macht.
Bemerkenswerterweise hat Gemini Ultra in 30 der 32 Benchmarks, die für LLM R&D verwendet wurden, die derzeitigen State-of-the-Art Ergebnisse übertroffen. Ebenso hat Gemini Pro eine beeindruckende Leistung gezeigt und GPT-3.5 in sechs von acht Benchmarks übertroffen. Heute ist es kostenlos in Bard und über Google-Apps verfügbar und somit “der leistungsstärkste kostenlose Chatbot auf dem Markt”.
In der Zwischenzeit integriert das Pixel 8 Pro nun das Gemini Nano, das On-Device-generative KI-Funktionen ermöglicht. Einige der spannenden neuen Funktionen umfassen “Zusammenfassen in Recorder”, “Smart Reply in Gboard”, modernste Videotechnologie und verbesserte Fotografie- und Bildbearbeitungsfähigkeiten.
This demo is incredible.
Check out this demo of them solving physics.
Gemini Nano now powers on-device generative AI features for Pixel 8 Pro