Googleは、人間の専門家を超えるスコアでMMLUで初めてのマルチモーダルAIであるGeminiを発表しました。GeminiはGoogleアプリに直接統合される予定であり、Ultra、Pro、Nanoの3つの異なるモデルを持つGPT-4の競合製品です。
Geminiの画像処理とリアルタイムの音声対応機能は、そのマルチモーダルな機能を確立しています。洗練された推論、マルチモーダリティ、進歩的なコーディングなど、その高度な機能によって、ChatGPT(GPT-4)モデルと比較して数学とコーディングの面で非常に優れています。
驚くべきことに、Gemini UltraはLLM R&Dに使用される32のベンチマークのうち30のベンチマークで先端技術の結果をしのぎました。同様に、Gemini Proは非常に優れた性能を示し、8つのベンチマークのうち6つでGPT-3.5を上回りました。今日、BardとGoogleアプリ上で無料で利用可能であり、市場で「最も強力な無料チャットボット」となっています。
一方、Pixel 8 Proでは、Gemini Nanoが搭載され、デバイス内の生成AI機能をパワーアップしています。そのエキサイティングな新機能には、「Recorderで要約」、「Gboardでスマートリプライ」、最先端のビデオ技術、強化された写真撮影と画像編集の機能などが含まれています。
This demo is incredible.
Check out this demo of them solving physics.
Gemini Nano now powers on-device generative AI features for Pixel 8 Pro