OpenAIは、GPT-4oの軽量版である「GPT-4o Mini」をリリースしました。このモデルは、コストパフォーマンスに優れ、テキストと画像の処理に対応したマルチモーダルAIです。将来的には動画や音声の処理も可能になる予定です。
GPT-4o Miniの主な特徴
- 低コストで高性能: GPT-3.5 Turboよりも高精度でありながら、コストは60%以上削減されています。
- マルチモーダル対応: テキストと画像の処理が可能で、将来的には動画や音声にも対応予定です。
- 広範なコンテキストウィンドウ: 12万8000トークンのコンテキストウィンドウを持ち、一度に大量の情報を処理できます。
- 高い安全性: 悪意のある情報のフィルタリングや、強化学習と人間のフィードバックによる精度向上に加え、「指示階層法」によりジェイルブレイクやプロンプトインジェクションへの耐性を強化しています。
GPT-4o Miniの性能
- 言語理解: マルチタスクの言語理解ベンチマークMMLUで82%のスコアを達成。Gemini FlashやClaude Haikuなどの類似モデルよりも高性能です。
- 数学的推論: 数学的推論のベンチマークテストMGSMで87.0%のスコアを獲得。
- コーディング: コーディングパフォーマンスを測定するHumanEvalで87.2%のスコアを獲得。
GPT-4o Miniの活用
GPT-4o Miniは、Assistants API、Chat Completions API、Batch APIを通じて利用可能です。低コストで高性能なこのモデルは、開発者が様々なアプリケーションを構築する上で強力なツールとなるでしょう。
まとめ
GPT-4o Miniは、コストパフォーマンスに優れた高性能なマルチモーダルAIです。テキストと画像の処理に対応しており、将来的には動画や音声にも対応する予定です。幅広い用途で活用できるこのモデルは、AIの利用をさらに促進することが期待されます。