新シリーズの推論モデル「OpenAI o1-preview」の紹介:難問解決に向けて

複雑な課題を解決するための、新たなAIモデルシリーズが登場。9月12日より提供開始

OpenAIは、回答前にじっくりと「思考」する時間を確保できるように設計された、新たなAIモデルシリーズを開発しました。科学、コーディング、数学など、様々な分野において複雑なタスクを論理的に処理し、従来のモデルよりも難しい問題を解決することができます。

本日、このシリーズの最初のモデルをChatGPTおよびAPIでリリースします。これはプレビュー版であり、定期的なアップデートと改善が予定されています。また、このリリースに合わせて、現在開発中の次のアップデートに向けた評価も公開しています。

その仕組み

o1-preview

私たちは、まるで人間のように、これらのモデルが回答する前に問題について深く考える時間を費やすよう訓練しました。訓練を通じて、思考プロセスを洗練させ、様々な戦略を試み、自身の誤りを認識することを学習します。

私たちのテストでは、次のモデルアップデートは、物理学、化学、生物学などの難しいベンチマークタスクにおいて、博士課程の学生と同等の性能を発揮しました。また、数学とコーディングにおいても優れていることがわかりました。国際数学オリンピック(IMO)の予選問題では、GPT-4oはわずか13%の問題しか正しく解けませんでしたが、この推論モデルは83%を達成しました。コーディング能力はコンテストで評価され、Codeforcesコンテストでは上位89%に達しました。詳細については、私たちの技術研究投稿をご覧ください。

初期モデルであるため、ChatGPTを便利にするウェブからの情報収集やファイル・画像のアップロードなどの機能はまだ搭載されていません。多くの一般的なケースでは、近い将来、GPT-4oの方がより有能になるでしょう。

しかし、複雑な推論タスクにおいては、これは大きな進歩であり、AI能力の新たなレベルを示しています。これを踏まえ、私たちはカウンターを1に戻し、このシリーズをOpenAI o1と命名しました。

安全性

これらの新しいモデルの開発の一環として、私たちは、安全および整合性ガイドラインを遵守させるために、その推論能力を活用する新しい安全トレーニングアプローチを考案しました。文脈の中で安全規則について推論できるようになることで、それらをより効果的に適用できます。

安全性を測定する1つの方法は、ユーザーが安全規則を回避しようとした場合(「jailbreaking」として知られる)に、モデルが安全規則に従い続ける能力をテストすることです。最も難しいjailbreakingテストの1つで、GPT-4oは22点(0~100点満点)でしたが、o1-previewモデルは84点を獲得しました。詳細については、システムカードと研究投稿をご覧ください。

これらのモデルの新しい能力に対応するため、私たちは安全対策、内部ガバナンス、連邦政府との協力を強化しました。これには、「Preparedness Framework」を用いた厳格なテストと評価、最高水準のレッドチーミング、安全&セキュリティ委員会によるものを含む取締役会レベルのレビュープロセスが含まれます。

AI安全への取り組みを進めるため、私たちは最近、米国および英国のAI安全研究所と正式な合意を結びました。私たちは、これらの合意を実行に移し始め、研究所にこのモデルの研究バージョンへの早期アクセスを提供しています。これは私たちのパートナーシップにおける重要な第一歩であり、将来のモデルの公開前および公開後の研究、評価、テストのプロセスを確立するのに役立ちました。

対象者

これらの強化された推論能力は、科学、コーディング、数学、および類似の分野における複雑な問題に取り組む場合に特に役立つ可能性があります。例えば、o1は、医療研究者が細胞配列データを注釈付けしたり、物理学者が量子光学に必要な複雑な数式を生成したり、あらゆる分野の開発者が複数ステップのワークフローを構築して実行したりするために使用できます。

OpenAI o1-mini

o1シリーズは、複雑なコードを正確に生成し、デバッグすることに優れています。開発者により効率的なソリューションを提供するため、私たちは、コーディングに特に効果的な、より高速で安価な推論モデルであるOpenAI o1-miniもリリースしています。o1-miniは、より小型のモデルであるため、o1-previewよりも80%安価であり、推論は必要だが幅広い世界知識は必要としないアプリケーションにとって強力で費用対効果の高いモデルとなっています。

OpenAI o1の使い方

o1-preview

ChatGPT PlusおよびTeamユーザーは、本日からChatGPTでo1モデルにアクセスできます。o1-previewとo1-miniの両方をモデルピッカーで手動で選択でき、リリース時点では、週当たりのレート制限はo1-previewが30メッセージ、o1-miniが50メッセージとなります。私たちは、これらのレートを引き上げ、ChatGPTが特定のプロンプトに対して適切なモデルを自動的に選択できるように取り組んでいます。

ChatGPT EnterpriseおよびEduユーザーは、来週から両方のモデルにアクセスできるようになります。

API使用ティア5の資格を持つ開発者は、本日からAPIで両方のモデルのプロトタイプ作成を開始でき、レート制限は20 RPMです。さらなるテストの後、これらの制限を引き上げる予定です。これらのモデルのAPIには、現在、関数呼び出し、ストリーミング、システムメッセージのサポート、その他の機能は含まれていません。開始するには、APIドキュメントをご覧ください。

また、すべてのChatGPT Freeユーザーにo1-miniアクセスを提供する予定です。

今後の展望

これは、ChatGPTおよびAPIにおけるこれらの推論モデルの初期プレビューです。モデルのアップデートに加えて、ブラウジング、ファイルと画像のアップロード、その他の機能を追加して、すべての人にとってより便利にする予定です。

また、新しいOpenAI o1シリーズに加えて、GPTシリーズのモデルの開発とリリースも継続する予定です。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール