ChatGPTは、多くのユーザーに利用されているAIツールの一つですが、今回はその新バージョンである「GPT-o1」が登場しました。
このモデルは、従来のGPTシリーズを基盤としつつ、さらに高い応答性や多様な機能を搭載しており、ビジネスや開発者向けのツールとして注目されています。
本記事では、o1-previewやo1-miniという新しいバージョンに関して、その特徴、料金体系、使い方を詳しく解説します。
また、GPT-4との違いや、Claude 3.5との比較など、AIツールの選択に役立つ情報も含め、GPT-o1がどのような場面で最適かも解説しているので、AI技術の進化を活用して自分のニーズに合った最適なツールを見つけましょう。
OpenAIの新たなモデル「OpenAI o1」がスゴイ!
冒頭でお伝えしたとおり、OpenAIは新たなモデルとして「OpenAI o1」をリリースしました。
まずは、OpenAI o1がChatGPT-4oと比較して、どのような点が優れているのか確認していきましょう。
▷o1-previewについてまず知りたい方はコチラ
▷o1-miniについてまず知りたい方はコチラ
下図はChatGPT-4oとChatGPTo1の比較で、左からAIME試験、Codeforces、PhD-Level Science Questions (GPQA Diamond)での各スコアです。
- AIME試験:アメリカの優秀な高校生が招待され挑戦する、招待制の数学試験
- Codeforces:競技プログラミングコンテストを運営する人気サイト
- PhD-Level Science Questions (GPQA Diamond):難解な化学、物理学、生物学に関するベンチマークテスト
2024年のAIME試験では、出題される15問中GPT-4oは平均12% (1.8/15問)しか問題を解けなかったのに対し、o1は、1回の解答で平均74% (11.1/15問)、同一問題を64回解答させ、その内の多い方を解答とした場合平均83% (12.5/15問)、更に1000個の学習済みスコア関数で再順位付けを行うと93% (13.9/15問)でした。
13.9というスコアは、全米で上位500人の中に入り、アメリカの数学オリンピックの選抜基準を上回る成績になります。
上図は、Codeforces が主催する競技プログラミングコンテストをOpenAI社がシミュレートし、o1モデルのコーディングスキルを試験したスコアです。
評価は競技会のルールと厳密に一致させ、10回コンテストを行います。
GPT-4oのEloレーティングは808で、人間の競技者の下位11%となったのに対し、o1-previwは上位38%、o1上位11%、o1-ioi(競技用に強化されたもの)は上位7%の非常に優れた成績を残したことから、GPT-4oとのプログラミングに対する優位性がお分かりいただけるかと思います。
上図は化学、物理学、生物学の専門知識をテストする難解な知能ベンチマークであるGPQA(A Graduate-Level Google-Proof Q&A Benchmark)のダイヤモンドレベルでGPT-4o、o1-preview、o1、専門家で比較したものです。
OpenAI社は、o1モデルを人間の専門家と比較するために、GPQAダイヤモンドの質問に答えられる博士号を持つ専門家を募集したそうです。
その結果、o1が人間の専門家の成績を上回り、このGPQAで人間を上回った最初のAIモデルとなりました。
この結果は、o1がすべての点で博士号取得者よりも有能であることを意味するものではなく、博士号取得者が解くと予想されるいくつかの問題を解くのにこのモデルがより熟練していることを意味する。
OpenAI
いよいよAGI(汎用人工知能)とASI(人工超知能)の後ろ姿が少し見えてきた気がしますね。
GPT-4oとo1-previewの違い まとめ
GPT-4oとo1-previewの違いは、その性能や目的に大きく関連しています。
GPT-4oは、広範なデータセットを学習し、非常に高度なタスクにも対応できる汎用的なAIモデルで、大量のデータ処理や、より複雑な文章生成、分析タスクにおいて強力なパフォーマンスを発揮します。
一方、o1-previewは、GPT-4をベースにしつつも、下記2つにおいてGPT-4oと異なる最大の特徴と言えるでしょう。
GPT-4oと異なる最大の特徴1:連鎖的思考
・問題を分解し小さなステップから思考する
・論理的に各ステップを分析する
・ステップとステップの関係を理解する
・解決に向けて段階的に推論を進め、最終的な解決策を探る
GPT-4oと異なる最大の特徴2:自己反省と修復
・都度思考プロセスを評価し、結論に至らせる
・矛盾点や誤りを特定する
・矛盾点や誤りが見つかった場合、異なる試行を行う
・信頼性と精度向上させつつ、解決策を出す
その他、応答速度の向上や、特定の業務プロセスに対する高度な精度が求められる環境で、o1-previewは有利です。
もう一つの大きな違いは、APIの使いやすさとその最適化です。
o1-previewは特定のシーンに特化しており、リアルタイムでの対話や、即応性が重要視される業務プロセスに向いています。
また、開発者やビジネス用途を前提とした設計により、APIを通じて簡単に統合・利用できる点が強みです。
o1ベータ時点で制限事項
ベータ段階では、GPT-4oに搭載されている多くの機能をまだ利用できません。
ベータ段階では科学分野や数学分野などに特化させた使い方、GPT-4oは普段使いと分けて考えた方がよさそうです
こうした違いを理解することで、どちらのモデルを利用するべきかを判断する際に重要な基準となります。
理系(o1)、文系(4o)と考えましょう♪
GPT-4oについては下記をご覧ください。
OpenAI o1「o1-preview」と「o1-mini」について
続いて、OpenAI o1の「o1-preview」と「o1-mini」について、深掘りしていきましょう。
o1-previewとは?
OpenAIがリリースした「GPT-o1」は、特に開発者やビジネスユースを念頭においたモデルです。
このモデルの最初の公開版が「o1-preview」と呼ばれており、o1-previewは主に開発者向けの初期リリースであり、限定的な利用者に提供されていますが、GPT-4を基盤とし、さらに進化した技術が搭載されています。
特に、処理速度や複雑な質問に対する応答精度が向上している点が特徴です。
従来のChatGPTと比較して、高度なタスクの処理や、リアルタイムの応答性が求められる環境で優れたパフォーマンスを発揮します。
開発者はAPIを通じて、このo1-previewを試すことができ、最新のAI機能を体験しながら、実際の利用シーンに応じたフィードバックを収集することが可能です。
また、o1-previewはベータテスト版であるため、今後さらに改善が加えられる予定です。
o1-miniとは?
「o1-mini」は、o1-previewの軽量版モデルです。
このバージョンは、リソースの制約がある環境やモバイルデバイス向けに最適化されており、パフォーマンスを抑えつつ、依然として高度なAI機能を提供します。
データ処理速度や応答時間はo1-previewに比べて若干遅いものの、日常的な対話や中程度の複雑なタスクには十分な能力を発揮します。
o1-miniは消費電力を抑えた設計により、モバイルデバイスやリソースが限られた環境での利用が見込まれており、特にエッジコンピューティングやモバイルアプリケーションのバックエンドにおいて非常に有効です。
このように、ユーザーは環境やニーズに応じて、o1-previewとo1-miniを使い分けることができます。
▷OpenAI o1<preview/mini>の使い方はコチラから
o1-previewとo1-miniの料金体系
o1-previewとo1-miniは、Chat GPT PlusやChat GPT Teamなどの有料プランで利用可能で、有料プランに加入していれば追加料金は必要なく利用が可能です。
ただし、すでに出ている公式アナウンスでは、無料プランユーザーにもo1-miniを公開する予定だそうです。
OpenAI o1のAPI料金
o1-preview | o1-mini | |
入力料金 | 1Mトークン当たり$15 | 1Mトークン当たり$3 |
出力料金 | 1Mトークン当たり$60 | 1Mトークン当たり$12 |
出力トークン数の限界 | 32,768トークン | 65,536トークン |
コンテキストウィンドウ | 128,000トークン | 128,000トークン |
知識の最新情報 | 2023年10月 | 2023年10月 |
OpenAIは、o1-previewおよびo1-miniのAPI利用に対して新しい料金体系を導入し、この料金体系は利用するモデルの性能や使用頻度に応じて異なります。
まず、o1-previewは、最も高度な性能を持つため、APIの利用料金もやや高めに設定されており、ビジネス用途や高度な分析、開発者向けに最適化されたプランです。
一方、o1-miniは、リソースの消費が少なく、比較的軽量なモデルであるため、API利用料が抑えられています。
小規模なプロジェクトや、予算の限られた利用者に適した価格設定がされており、個人開発者や小規模なスタートアップでも導入しやすい形になっています。
OpenAI o1(o1-preview)の使い方
メールアドレス、もしくはGoogle、MicrosoftやAppleのアカウントで登録する事も可能です。
登録出来たら上図箇所にある「アップグレードする」をクリックします。
GPT-o1を使用するためには有料の月額登録を行う必要があります。
PCブラウザアクセスでのo1の使い方
アプリの場合
ChatGPT Plus/ChatGPT Teanの有料ユーザーであれば、サイトにアクセスし、上記画像箇所をクリックするとモデル切り替えが可能です。
Tips
APIでのo1-miniの使い方o1-miniは、軽量かつ効率的なAIモデルで、主にモバイルアプリケーションやリソースが制限された環境での利用が推奨されています。
その使い方は非常にシンプルで、OpenAIが提供するAPIにアクセスし、テキストリクエストを送信するだけです。
たとえば、チャットボットのバックエンドとしてo1-miniを利用する場合、エンドポイントにユーザーの入力テキストを送信し、AIが生成する応答を受け取り、リアルタイムでの対話が可能となります。
開発者向けには、OpenAIの公式ドキュメント が提供されており、初期設定やAPIの統合方法が詳しく説明されています。
o1-miniは特に、リソースの効率性が求められるシステムに向いており、モバイルデバイスや小型デバイス上でAIの応答を高速かつ正確に提供できるのが強みです。
また、軽量であるため、インターネット接続が不安定な環境でも安定した動作が期待でき、開発者にとって非常に使いやすい選択肢となっています。
注意
o1 モデルは現在ベータ版であり、ティア5のユーザーのみに公開されています。
一般公開後は、先にお伝えしてある料金表のとおりになるようです。
「o1-preview」と「o1-mini」実際に使ってみた
GPT-o1はGPT-4oと異なり、指示を行うためのプロンプトはステップバイステップや複雑な物ではなく、極力シンプルな物にする必要があります。※区切り記号(#や-)は引き続き使用可能です。
o1-mini
以下のプロンプトを使用して作成してみます。
# 日本の宝くじシミュレーターをTypescriptで作成してください。
- 1枚300円
- 1等は1ユニット当たり1枚
- 1ユニット = 1000万枚
- 宝くじの組は01~200組であり、200種類の中から各組の番号の下2ケタを「00~99」で100種類そろえたもの
- 1組あたり100000番から199999番の10万通りある
- 購入枚数を入力できる
- 必要合計金額の表示
- 購入ボタン
- リセットボタン
- 再抽選ボタン
プロンプト実行結果
提示されたプログラムの実装結果
Typescriptの指示しかしていませんでしたが、Webアプリの想定としてReactで実装できるようにしてくれていることに驚きました。
o1-preview
こちらもプロンプトは同じものを使用します。
# 日本の宝くじシミュレーターをTypescriptで作成してください。
- 1枚300円
- 1等は1ユニット当たり1枚
- 1ユニット = 1000万枚
- 宝くじの組は01~200組であり、200種類の中から各組の番号の下2ケタを「00~99」で100種類そろえたもの
- 1組あたり100000番から199999番の10万通りある
- 購入枚数を入力できる
- 必要合計金額の表示
- 購入ボタン
- リセットボタン
- 再抽選ボタン
プロンプト実行結果
previewはminiと異なり、痒いところ(React)には手が届きませんでしたが、その分前段階を厳密に作成してくれている感じですね。
Reactで実装してみました
サクッと動くものを見たい場合は「mini」、ある程度要件定義が出来ているものに関しては「preview」でじっくりと作成すると良いような感じがしました。
OpenAI o1に関するよくある質問
最後に、OpenAI o1に関するよくある質問とその回答を紹介していきます。
o1-previewの利用回数制限は?
o1-previewの利用には、OpenAIが設定した週間のリクエスト数に基づく制限があります。
ベータ公開から正式公開された際には、商用利用者や、より多くのリクエストを必要とするビジネスプランでは、この制限を大幅に緩和されることが予測されます。
o1-preview | |
1日の利用回数制限 | 情報なし |
1週間の利用回数制限 | 50回 |
o1-miniの利用回数制限は?
o1-miniも同様に、1日間のリクエスト回数に制限があります。
o1-mini | |
1日の利用回数制限 | 50回 |
1週間の利用回数制限 | 情報なし |
この制限は、リソースを効率的に配分するために設けられており、より多くの利用が必要な場合には正式公開時の情報まで待つ必要がありそうです。
o1-previewは無料?
o1-previewは残念ながら無料プランでは利用できません。
Chat GPT PlusやChat GPT Teamなどの有料プランで利用可能です。
ただし、すでに出ている公式アナウンスでは、無料プランユーザーにもo1-miniを公開する予定だそうです。
o1の読み方は?
「o1」は公式には「オーワン」と読みます。
これは、OpenAIの技術的進化を象徴する命名であり、従来の「GPT」シリーズとは一線を画す新しい方向性を示しています。
複雑な推論タスクの場合、これは大きな進歩であり、AI 機能の新たなレベルを表しています。
https://openai.com/index/introducing-openai-o1-preview/
これを踏まえ、カウンターを 1 にリセットし、このシリーズを OpenAI o1 と名付けます。
OpenAI o1とClaude 3.5どっちがいい?
OpenAI o1とClaude 3.5は、いずれも先進的なAIモデルですが、それぞれ異なる用途に適しています。
Claude 3.5は特に会話形式での応答性能に優れており、人間に近い対話体験を提供することが強みです。
一方で、o1-previewは、特定の業務プロセスや複雑なタスク処理に特化しており、特にリアルタイム応答やビジネス向けのAI機能が求められる場合には優れた選択肢となります。
どちらを選ぶかは、利用目的や求める性能によって決まるため、まずは自分のニーズに最適なモデルを見極めることが大切です。
まとめ
OpenAIの新しいAIモデル「o1-preview」と「o1-mini」は、それぞれ異なる用途やニーズに応じた多様な機能を提供しています。
o1-previewは高度な応答性と複雑なタスク処理を求めるプロフェッショナル向けに、o1-miniは軽量で効率的なAI機能を必要とするモバイル環境や小規模プロジェクト向けに設計されています。
料金体系や利用制限を把握し、自分に最適なモデルやプランを選ぶことで、AI技術を最大限に活用することができるでしょう。
今後のAI活用の可能性を広げる上で、OpenAI o1は有力な選択肢となるでしょう。