ChatGPTを開発するOpenAIが、2024年5月13日に新たな生成AIモデル「GPT-4o」をリリースしました。マルチモーダル対応により、テキストだけでなく画像や音声も扱えるのが特徴です。さらに、GPT-4と比べて応答速度が向上し、API利用料金も抑えられています。
ChatGPT無料版でも利用できるGPT-4o。今回は、その実力を最大限に引き出す活用法をご紹介します。
無料版でも使える!GPT-4oを使ってみよう
GPT-4oを使うには、ChatGPTの設定でモデルを「4o」に切り替えるだけ。画像生成やファイルアップロードで、GPT-4oの力を体感できます。
ただし、無料版は利用回数に制限があります。筆者の場合、10回ほどの利用で制限がかかり、解除まで24時間ほどかかりました。本格的に活用したい場合は、有料版「ChatGPT Plus」の契約をおすすめします。
GPT-4oで何ができる?4つの活用法をご紹介
画像分析で写真の場所を特定
台湾で撮影した写真をアップロードし、「この写真を分析してください」と指示すると、GPT-4oは建物の特徴を分析し、九份の「阿妹茶樓」だと特定しました。GPT-4では詳細な場所までは特定できませんでしたが、GPT-4oは画像分析能力に優れていると言えるでしょう。
OCR機能で名刺やレシートの情報を抽出
GPT-4oはOCRツールとしても活躍します。名刺を撮影し、「CSVデータを作成してください」と指示すると、氏名や会社名などの情報を抽出し、CSVファイルに出力できました。複数枚の名刺を同時に読み込むと誤読が発生することもありますが、1、2枚であればほぼ正確にデータ化できます。
レシートからも、日付や金額などの情報を抽出し、CSVファイルにまとめることが可能です。
高精度な翻訳機能で海外旅行をサポート
海外旅行先でメニューが読めない時、GPT-4oに「日本語に翻訳してください」と指示すると、今日の為替レートで価格を円換算し、料理の説明も付けてくれます。GPT-4よりも正確な翻訳結果が得られました。
デスクトップアプリでセキュリティー対策にも
ChatGPTのデスクトップアプリ(macOS版)でもGPT-4oが利用できます。スクリーンショットや写真をGPT-4oに送って質問したり、ネット詐欺の画像を表示して危険性を確認したりできます。
まとめ:GPT-4oは可能性無限大!
GPT-4oは、画像分析、OCR、翻訳、セキュリティー対策など、幅広い用途で活用できる可能性を秘めています。無料版でもその力を試せるので、ぜひ一度体験してみてください。