中国のDeepSeekが待望の新型AIモデルを発表〜OpenAIを追走

DeepSeek

記事サマリー

中国のスタートアップ企業DeepSeekは、コストを大幅に削減しつつ超長文コンテキスト(最大100万トークン)に対応した最新AIモデル「DeepSeek-V4」を発表しました。本モデルは高性能な「Pro」と軽量な「Flash」の2版展開で、特に世界知識や推論能力において米GoogleのGeminiに匹敵する性能を誇ります。

同社はオープンソース戦略を維持しており、低コストで高効率な開発手法は業界の「転換点」と評されています。一方で、米政府は中国によるAI技術の「蒸留(盗用)」を非難しており、米中対立が激化。V4の登場は、昨年の「DeepSeekショック」に続く、技術・経済両面での大きな衝撃を与えています。

新型AIモデル登場

同社はソーシャルメディアプラットフォームWeChat上の声明で、「DeepSeek-V4は超長距離のコンテキストを特徴としている」と述べ、「世界をリードする」と称賛した。

中国のスタートアップ企業DeepSeekは金曜日、コストを「大幅に削減」した新しい人工知能モデルを発表した。同社は1年以上前に、米国の競合企業と同等の能力を持つ低コストの推論モデルを発表し、世界を驚かせたばかりだ。

人工知能(AI)開発競争は中国と米国の対立を激化させており、ホワイトハウスは木曜日、中国の組織が人工知能技術を盗むための大規模な取り組みを行っていると非難した。

杭州に拠点を置くDeepSeekは、昨年1月に独自のR1推論モデルを搭載した生成型AIチャットボットを発表し、戦略分野における米国の優位性という従来の認識を覆す快挙を成し遂げた。

DeepSeek-V4は「超ロングコンテキストを特徴とする」と、同社はソーシャルメディアプラットフォームWeChatの声明で述べ、Xに関する別の発表では「計算(および)メモリコストを大幅に削減した世界最先端の」ものだと称賛した。

トークンが100万個

V4は、単語や句読点などのテキストの小さな構成要素である「トークン」を100万個までコンテキスト長としてサポートしており、GoogleのGeminiと同等の性能を備えている。

コンテキストの長さは、モデルがタスクを完了するためにどれだけの入力を吸収できるかを決定します。

新しいV4は、DeepSeek-V4-ProとDeepSeek-V4-Flashの2つのバージョンでリリースされ、後者はパラメータが小さいため、「より効率的で経済的な選択肢」となっている。

DeepSeek社によると、推論能力の指標となる「世界知識」という点では、V4-Proは最新のGeminiモデルに次ぐ性能を誇るという。

同社は、オープンソースモデルの「プレビュー版」が現在利用可能であると述べたが、最終版のリリース時期については明らかにしなかった。

変曲点がきた

専門家によると、V4の登場はハードウェアとコストの面で「転換点」となるという。

「これは、コンテキストの長さが長いことに伴うパフォーマンスの低下やコストの上昇といった長年の課題に対処するものであり、業界にとって真の転換点となる」と、テクノロジー調査会社iiMediaの創設者である張毅氏はAFP通信に語った。

「エンドユーザーにとって、これは広く利用しやすいメリットをもたらすでしょう。例えば、超長文コンテキストのサポートが標準機能になれば、長文テキスト処理はハイエンドの研究室にとどまらず、主流の商用アプリケーションへと普及していくと予想されます」と彼は述べた。

V4-Proは1.6兆個のパラメータを持ち、V4-Flashは2840億個のパラメータを持ち、これらによってモデルの意思決定能力が向上します。

DeepSeekの声明によると、このモデルはClaude Code、OpenClaw、OpenCode、CodeBuddyといった人気のAIエージェント製品向けに「最適化」されているとのことだ。

ベテランAI業界アナリストのマックス・リウ氏は、DeepSeekの最新リリースは中国企業にとって「画期的な出来事」だと述べた。

「これは国内のAI業界全体にとって良いことだ。国内ユーザーにより優れたモデルを提供できるようになり、今後はより多くの製品や、より競争の激しい市場など、多くのことが期待できる」と彼はAFP通信に語った。

「もしこの新しいモデルが本当に欧米の研究機関が開発した主要モデルの性能に匹敵するなら、これはDeepSeekが初めて登場した時と同じくらい衝撃的なことだ」と彼は付け加えた。

スプートニク・モーメントが来た

昨年発生した、いわゆる「ディープシーク・ショック」は、AI関連株の売り浴びせと事業戦略の見直しを引き起こし、業界にとっての「スプートニク・ショック」とも評された。

このチャットボットはChatGPTやその他の主要なアメリカ製サービスと同等の性能を発揮したが、開発に必要なコンピューティング能力は大幅に少なかったと同社は述べている。

しかし、その急激な人気はデータプライバシーや検閲に関する疑問を提起し、チャットボットは1989年の天安門事件のようなデリケートな話題に関する質問への回答を拒否することが多かった。

国内では、DeepSeekのAIツールは、中国の自治体や医療機関だけでなく、金融業界やその他の企業にも広く採用されている。

これは、DeepSeekが自社のシステムをオープンソース化し、その内部構造を公開するという決定を下したことが一因となっている。これは、OpenAIやその他の欧米の競合他社が販売する独自のモデルとは対照的である。

しかし、ホワイトハウスは、来月北京で予定されているドナルド・トランプ大統領と習近平国家主席の首脳会談を前に、中国企業がアメリカの技術を「盗もう」と競い合っていると非難している。

「米国は、主に中国の外国組織が、米国のAIを盗むために産業規模の蒸留キャンペーンを実施しているという証拠を持っている」と、トランプ大統領の科学技術担当首席顧問であるマイケル・クラツィオス氏はXへの投稿で述べた。

蒸留はAI開発において一般的な手法であり、企業が自社モデルのより安価で小型なバージョンを作成するためによく用いられる。

DeepSeekが金曜日に発表を行ったのと時を同じくして、Metaは人工知能への大規模投資と並行して、残りの従業員の生産性向上を目指し、従業員の1割を削減する計画だと発表した。また、Microsoftも人員削減を検討しているとの報道もあった。

そんなところで

PVアクセスランキング にほんブログ村

AI,ニュース

Posted by tomoyamurakami