Python学院
メールマガジンバックナンバー

  • ChatGPT
  • メールマガジン

話題の最新モデル「GPT-4o」についてご紹介!GPT-4との違いとは?

今回のテーマは「GPT-4o(Omni)」でございます。

(約5分で読めます)

~~~~~~~~~目次~~~~~~~~~
1. GPT-4o(Omni)とは?
2. GPT-4oの4つの特徴
①視覚・音声理解における性能の向上
②APIが従来の半額で利用できる
③無料版でも制限付きで利用可能
④セキュリティ対策
3. おわりに
~~~~~~~~~~~~~~~~~~~~


1. GPT-4o(Omni)とは?

GPT-4oはOpenAIが開発した新しい大規模言語モデル(LLM)です。 モデル名の「o」はOmniの略称であり、「あまねく、すべて」という意味の単語です。
テキスト、音声、視覚にまたがるマルチモーダル性能に磨きをかけたこと、 英語以外の言語のパフォーマンスが向上したことを示します。

特徴については次章で紹介いたします。


2. GPT-4oの4つの特徴

①視覚・音声理解における性能の向上

GPT-4oはテキスト、ビジョン、オーディオにわたって単一の新しいモデルを使用しています。
これにより、今まで複数のモデルを連携していた画像や音声のやり取りにおいても、 多くの情報を素早く処理することができます。
特に音声による会話においては、より返答が人間の返答スピードに近くなりました。 音声入力に対して最短232ミリ秒、平均320ミリ秒で応答することができ、 これは人間の応答時間とほぼ同じとされています。
OpenAIからの発表では、笑い声や歌を発声する様子が動画で紹介されています。
また、英語以外の言語におけるテキストの改善も行われたといいます。

Open AI社の発表におけるGPT-4oとの対話:https://www.youtube.com/watch?v=DQacCB9tDaw
※9:40ごろから、GPT-4oとの対話をご覧いただけます。

②APIが従来の半額で利用できる

GPT-4oでは、従来の「GPT-4 Turbo」に比べて約半額でAPIを利用することができます。 GPT-4 Turboでは、100万トークン当たり入力10ドル、出力30ドルであったことに対し、 GPT-4oは100万トークン当たり入力5ドル、出力15ドルで利用することができます。

③無料版でも制限付きで利用可能

GPT-4oは、無料版でも利用できるように設定されています。
無料版でログインを行って質問を投げかけ、返答の左下(評価ボタンの横)の 星マーク(3.5なら雷マーク)からモデルの確認・変更することが可能です。




しかし、GPT-4oを使用して送信できるメッセージの数には制限があり、 使用状況と需要に応じて異なります。(制限数はおよそ3~5時間ごとに最大10メッセージと言われています)
利用できない場合、無料枠ユーザーは GPT-3.5に戻ります。

一方で、有料版(Plusユーザー)はGPT-4oで3時間ごとに最大80件のメッセージを送信できます。
GPT-4oの特徴は先ほどお話しした通りですが、その他の機能の多くは GPT-3.5ではなくGPT-4と同様です。
GPT-4oでも使用できる機能については、以下の研修で解説しています。

・(半日研修)GPT-4理解研修~話し言葉でプログラムが書けるCode Interpreterで業務を効率化する
https://www.insource.co.jp/bup/bup-code-interpreter.html

④セキュリティ対策

GPT-4oデータのフィルタリングやモデルの行動の調整を通じて、安全性を確保しています。
また、70人以上の外部の専門家によるリスク評価も行われており、モデルの安全性を担保しているといいます。


3. おわりに

今回は、GPT-4o(Omni)とその特徴についてご紹介しました。
より業務の効率化に活用できそうなアップデートと存じます。 無料版をご利用の方も使用できますので、ぜひChatGPT-4oの便利さを体感してみてください。

関連研修