Python学院
メールマガジンバックナンバー

  • ChatGPT
  • メールマガジン

Gemini 1.5 Proについてご紹介! ChatGPTとの違いとは?

今回のメールでは、ChatGPT(GPT-4)と同様のマルチモーダルAIである「Gemini 1.5 Pro」というモデルの情報を、ChatGPTと比較しながらお伝えします。

(約5分で読めます)

~~~~~~~~~~~~~~目次~~~~~~~~~~~~~~
1.Gemini 1.5 Proとは?
2.Gemini 1.5 ProとChatGPT(GPT-4)の違いや特徴
3.Gemini 1.5 Proを試してみました!
4.おわりに
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


1.Gemini 1.5 Proとは?

Geminiとは、Googleが開発した生成AIです。
Gemini 1.5 Proは2024年2月に発表され、現在はすべてのユーザーが無料で使用することができます。


2.Gemini 1.5 ProとChatGPT(GPT-4)の違いや特徴

「Gemini 1.5 Proがすごい!」という情報を多く目にしたため、どのようにすごいのかを、ChatGPT(GPT-4)と比較してみました。


比較した表は上の通りです。
Gemini 1.5 Proは、トークン数(入力に必要なデータ量や文字数)が多いことや、テキストや画像はもちろん、音声・動画を入力できることも、大きな特徴です。
トークン数が最大100万で、1時間の動画を読み込むことも可能なようでした。

反対にChatGPTでは、パラメータ(AIのモデルがデータから学習する際に、正確な結果を出せるようになるために調整できる変数)が多いことが特徴です。
パラメータが多くなればなるほど、より高度な言語生成能力をもつといえます。
そのため、現段階ではGeminiよりもChatGPTの方が、精度の高い出力をしてもらえる可能性が高いと考えられます。さらに、ほぼすべてのファイルを入力できるため、Geminiよりも汎用的だと感じました。


3.Gemini 1.5 Proを試してみました!

Gemini 1.5 Proは動画で、ChatGPT(GPT-4)ではファイルでの入力が可能なため、地震のシミュレーションを行っているGIFファイルを使用し、質問をしてみました。
(今回使用したシミュレーションプログラムの作成方法はコチラ!

まず基準としてChatGPT(GPT-4)で試してみました。
質問文(プロンプト)は以下の通りです。


回答は以下の画像の通りです。


数学的関数の3DプロットについてもChatGPTに聞いたところ、三次元空間内で数学的な関数の値を視覚的に表現する方法とのことでした。
実際に三次元データの可視化した動画であることや、②の質問で地震についての出力があったことから、正確にファイル内容を読み取れていると感じました。

これを踏まえ、マルチモーダルでGeminiを利用できるGoogle AI Studioでも、同様に質問してみました。


回答は以下の画像の通りです。


Geminiも「三次元空間における複雑な波動現象を視覚的に表現」という表記から、正確に動画の内容を読み取れていることがわかります。
また地震は、岩盤がずれ動くことによって地中に振動が生じ、周囲に波として伝わる現象のため、「流体力学における波の伝播」という予想は、かなり的を射ているのではないでしょうか。

②の質問に関しては、現実にすでにありそうなChatGPTの回答と比べて、少しクリエイティブな回答のように感じました。

※GPT-4とGoogle AI Studioともにユーザデータが学習に利用される可能性があります。
 そのため、個人情報は入力しないように細心の注意を払ってご利用くださいませ。


4.おわりに

今回は、ChatGPT(GPT-4)と比較しながら、Gemini 1.5 Proという生成AIモデルについてご紹介しました。
生成AIを使ってどのようなことを実現したいのか?を考え、目的に合わせてツールを選択していただけましたら幸いです。

関連研修