基盤モデル

Foundation Model

基盤モデルとは

基盤モデル(Foundation Model)とは、大規模なデータセットで事前学習され、ファインチューニングやプロンプトエンジニアリングにより多様なタスクに適用できる汎用的なAIモデルのことです。2021年にスタンフォード大学HAI(Human-Centered AI)研究所が提唱した概念で、GPT-4、Claude、Gemini、LLaMAなどのLLMや、Stable Diffusion等の画像生成モデルが基盤モデルに該当します。

基盤モデルの特徴

基盤モデルの最大の特徴は「汎用性」です。一つのモデルが翻訳、要約、質問応答、コード生成、画像認識など、多岐にわたるタスクをこなせます。これは、大規模な事前学習によりモデルが世界の広範な知識と推論能力を獲得しているためです。また、Few-shotやZero-shotで新しいタスクに対応できる「創発的能力」(Emergent Abilities)も重要な特性です。

基盤モデルの社会的影響

基盤モデルは、従来のタスク特化型AIとは異なり、一つのモデルが多くの応用を支えるプラットフォーム的な存在です。そのため、モデルの偏りや問題が広範な下流タスクに波及する「均質化リスク」があります。また、開発には膨大な計算資源とデータが必要であり、大企業や研究機関への集中化も課題です。オープンソースの基盤モデル(LLaMA、Mistralなど)の登場は、この集中化に対抗する重要な動きとして注目されています。