GPT-4とは
GPT-4(ジーピーティーフォー)は、OpenAIが2023年3月にリリースした大規模マルチモーダル言語モデルです。テキストだけでなく画像も入力として受け付けることができ、前モデルであるGPT-3.5と比較して大幅に性能が向上しました。推論能力、知識の正確性、複雑なタスクへの対応力において、当時の最先端性能を達成しました。
GPT-3.5からの進化点
GPT-4は、司法試験で上位10%に入るスコアを達成するなど、高度な知的タスクにおいて人間レベルの性能を示しました。ハルシネーション(事実に反する情報の生成)が大幅に低減され、より長い文脈(最大32Kトークン)を扱えるようになりました。また、安全性の向上にも注力され、有害なコンテンツの生成を82%削減することに成功しています。
マルチモーダル機能
GPT-4の革新的な特徴の一つがマルチモーダル入力対応です。テキストに加えて画像を入力することで、画像の内容を理解し、それに基づいた回答や分析を行うことができます。グラフの解読、手書きメモの理解、画像内のテキスト認識など、視覚情報の処理が可能になりました。
利用方法と展開
GPT-4はChatGPT Plus、OpenAI API、Microsoft Copilotなど、複数のプラットフォームで利用可能です。多くの企業がGPT-4をベースにしたアプリケーションやサービスを開発しており、AI業界の標準的なベンチマークモデルとしても広く認知されています。