AI技術は近年目覚ましい進化を遂げており、私たちの生活に様々な形で浸透しつつあります。
そんな中、Microsoftは2024年4月にコスト効率の高い小規模言語モデル「Phi-3」をリリースしました。
ただ、Phi-3について、以下のように思う方もいらっしゃるのではないでしょうか。
- Phi-3って、聞いたことあるけどよくわからない…
- Phi-3って、どうやって使うの?
本記事では、Phi-3の概要や具体的な使い方などを詳しく解説しますので、ぜひ最後までご覧ください。
Phi-3とは?
Phi(ファイ)-3は、マイクロソフトが開発した最新のAI言語モデルです。
従来の言語モデルと比べて、優れている点は以下の通りです。
- 高い処理速度と低遅延:処理速度が向上し、データ通信がスムーズになることで、リアルタイム応答が可能
- 小型で軽量なモデル:小型で軽量なモデル設計により、低スペックなデバイスでも動作させることが可能
- 高い汎用性:言語処理、コード生成、数学問題の解法など、幅広いタスクにおいて高い性能を発揮
Phi-2との違い
マイクロソフトが2023年11月に発表したAI言語モデル「Phi-2」と、最新の「Phi-3」を比較してみましょう。
全てのパラメータにおいて性能が向上していることがわかります。
たとえば、代表的な以下のパラメータの数値を参考にしてみてください。
MMLU:言語理解力を測る指標
BigBench-Hard:高難度の推論を測る指標
BoolQ:簡単な質問への回答力を測る指標
MBPP:プログラミング能力を測る指標
いずれの数値も「Phi-3」のほうが高いことがわかります。
他の言語モデルとの違い
「Phi-3」は他の言語モデルと比べても非常に優れていると言えます。
以下の図は、縦軸に“性能”、横軸に“モデルサイズ”を示したマッピング図ですが、「Phi-3-mini」は「Llama-3-8B-In」や「Gemma 7B」と比較して2倍以上小さいモデルであるにも関わらず、より性能が高いことが示されています。
「Phi-3-small」や「Phi-3-midium」についても、同様のサイズのモデルと比較して大幅に高い性能を有していることがわかります。
また、性能についても詳しく評価されており、「Phi-3-small」と「Phi-3-medium」は、「GPT-3.5 Turbo」よりも優れたパフォーマンスを発揮し、最新モデルである「Claude 3 Sonnet」と同等の性能を有しています。
Phi-3の3つのモデル内容
Phi-3には「Phi-3-mini」/「Phi-3-small」/「Phi-3-midium」が存在します。
それぞれの違いは以下の表の通りです。
Phi-3-mini | Phi-3-small | Phi-3-midium | |
パラメータ数 | 38億 | 70億 | 140億 |
トークン数 | 最大128,000トークン | 未公開 | 未公開 |
主な用途 | チャットボットなど | 文章生成など | アプリ開発など |
リリース時期 | 2024/4/23 | 近日中 | 近日中 |
一般的に、性能のパラメータ数が多いほどモデルは複雑な処理を行うことができる一方で、処理に時間がかかります。
つまり、高度な処理が必要な場合は「Phi-3-midium」>「Phi-3-small」>「Phi-3-mini」の順に使いやすいです。
一方で単純な処理で良いのであれば「Phi-3-mini」>「Phi-3-small」>「Phi-3-midium」の順で使いやすいでしょう。
Phi-3-mini
Phi-3-miniは、パラメータ数が38億であり、コスト効率の高い小型言語モデル です。
軽量で高速な処理が必要なタスク( 顧客対応、FAQ、チャットボット、音声認識、翻訳)や エッジデバイスでのAI活用(スマートスピーカー、ウェアラブルデバイス、スマートホーム機器)などの用途に適しています。
Phi-3-miniは、軽量モデルであり限られたリソースでのAI開発が可能なので、個人開発者や学生などに向いていると言えます。
Phi-3-small
Phi-3-smallは、パラメータ数が70億の小型言語モデル です。
より高度な文章処理が必要なタスク( 文章生成、要約、記事作成、論文執筆)や 創造的なコンテンツ制作(詩、小説、脚本、音楽作品)などの用途に適しています。
Phi-3-smallは、クリエイターやスタートアップ企業に向いていると言えます。
Phi-3-midium
Phi-3-midiumは、パラメータ数が140億の小型言語モデル です。
高度なコーディングや数学処理が必要なタスク( コード生成、デバッグ、数学問題の解法)や 高負荷な処理が必要なアプリケーション(ゲーム開発、シミュレーション、画像処理)などの用途に適しています。
Phi-3-midiumは、研究機関や大企業に向いていると言えます。
Phi-3-miniの使い方
Phi-3-miniは、以下の方法などで使用できます。
- Microsoft Azure AI Studioでモデルを選択して利用
- Hugging Faceからモデルをダウンロードして利用
- HuggingChatでモデルを選択して利用
- Ollamaをインストールして利用
今回はMicrosoft Azure AI Studioでモデルを選択して利用してみます。
「アナウンス」からPhi-3の“モデルの表示”を選択するか、検索窓に“Phi-3”などを入力し、使用したいモデルを探します。
続いて、「Phi-3-mini-4k-instruct」か「Phi-3-mini-128k-instruct」を選択しましょう。
画面右側の“試してみる”に入力窓があるので、英語でプロンプト(指示文)を入力し実行する。
※日本語はあまり対応できないので注意しましょう。
Phi-3-miniに必要なPCスペック
Phi-3-miniは、非常に軽量で効率的なモデルなので、ローカル環境でも十分動かすことができます。
具体的な情報はないですが、以下のポストのように、M1 Macでも動作するようです。
Phi-3の登場による新たな可能性
Phi-3の登場は、様々な分野に新たな可能性をもたらします。
以下に、いくつかの例を紹介します。
1. エッジデバイスでのAI活用
Phi-3-miniのような小型で軽量なモデルは、エッジデバイスでのAI活用に最適です。
これまでAIを利用することが難しかった様々なデバイスで、AI機能を実現することが可能になります。
たとえば、以下のような活用が考えられます。
- スマートスピーカー:音声コマンドによる操作や、より自然な会話型AIアシスタントの実現
- ウェアラブルデバイス:個人の体調や活動状況に合わせた情報提供や、ヘルスケアサポート
- スマートホーム: 家電の自動制御や、省エネ・快適な住環境の実現
- ロボット:自律的な行動や、人と協働するロボットの実現
2. リアルタイム処理の高速化
Phi-3の高い処理速度と低遅延は、リアルタイム処理を必要とする様々なアプリケーションでの活用に適しています。
たとえば、以下のような活用が考えられます。
- 自動翻訳:リアルタイムでの音声翻訳や、字幕生成
- 音声認識:より自然で高精度な音声認識の実現
- チャットボット:よりスムーズで自然な会話型チャットボットの実現
- オンラインゲーム:リアルタイムな対戦ゲームにおける、遅延のないゲーム体験の実現
3. AI開発の民主化
Phi-3のようなオープンソースで利用可能なモデルは、AI開発の民主化に貢献します。
これまでAI開発に関わる機会のなかった個人や中小企業でも、簡単にAIアプリケーションを開発することが可能になります。
Phi-3に関するよくある質問
Phi-3のよくある質問について、一問一答形式でまとめました。
Phi-3は無料?
Phi-3は無料で利用することができます。
Hugging FaceやOllamaなどを活用したり、Microsoft Azure AI Studio上で試用することも可能です。
Phi-3は商用利用可能?
Phi-3はMITライセンスのもとで提供されており、無料で商用利用することが可能です。
Phi-3は日本語で使える?
Phi-3は日本語に対応しきれていないのが現状であり、英語で利用するほうが好ましいです。
今後のアップデートに期待しましょう。
Phi-3はどんな人におすすめ?
Phi-3は以下のような方におすすめです。
AI開発者:新しいAIアプリケーションの開発や、既存のAIアプリケーションの改善に役立てたい人
データサイエンティスト:データ分析や機械学習のタスクを効率化したい人
学生:論文執筆やプレゼンテーションの作成などに役立てたい人
ビジネスパーソン:業務効率化や顧客満足度向上に役立てたい人
クリエイター:文章生成、翻訳、コード生成などのタスクを自動化したい人
Phi-3のリリース時期はいつ?
Phi-3-miniについては、2024/4/23に発表されました。
Phi-3-small、Phi-3-midiumについても、近日中に発表される予定です。
まとめ
それでは、本記事をまとめます。
- 「Phi-3」はコスト効率の高い小規模言語モデルであり、パラメータ数に応じて3種類存在する。
- 現在公開されている「Phi-3-mini」は、「Llama-3-8B-In」や「Gemma 7B」と比較して2倍以上小さいモデルであるにも関わらず、より性能が高い。
- Phi-3-miniは、軽量で高速な処理が必要なタスク(チャットボット、音声認識)や エッジデバイスでのAI活用(スマートホーム)に適している。
Phi-3は、従来のAI言語モデルとは一線を画す革新的な性能と軽量性を備えたAI言語モデルです。
様々な分野に新たな可能性をもたらし、私たちの生活をより便利で豊かにしてくれるでしょう。