AI戦略の見直しも必要?中国発DeepSeekの衝撃…なぜ今話題になっているのか

中国発AIへの評価を一変させた、コスト効率の高さ

ロゴ deepseek

2022年末にOpenAIのChatGPTが登場して以降、生成AIの競争が一気に加速しました。中国国内でも百度(Baidu)など大手企業が独自のチャットボットを開発しましたが、当初は先行する欧米のモデルに太刀打ちできるものではありませんでした。

しかし2024年末にDeepSeekが登場すると、この評価が一変します。DeepSeekはまず2024年11月に推論特化版の予備モデルを発表し、12月に汎用モデルDeepSeek-V3、そして年明け1月には先進的な推論モデルDeepSeek-R1と、立て続けにリリースをしました。

DeepSeek-V3はMoE(※1) と呼ばれるアーキテクチャを採用し、モデルのパラメータ数は実に6710億にも達します。また、一度に処理できる文脈の長さ(コンテキスト長)も最大128,000トークンと十分に大きく、OpenAI社のGPT-4oなど従来の各社フラッグシップモデルと並びます。

<!–

見出し

–>

※1 Mixture-of-Expertsの略。複数の専門的なニューラルネットワーク(エキスパート)を組み合わせて、タスクに応じて最適なエキスパートを選択するアーキテクチャ。各エキスパートが特定の入力パターンや問題領域に特化することで、全体として効率的で高性能なモデルを実現する。

DeepSeek-V3は、わずか2カ月の期間と600万ドル以下の計算コストとで訓練できたとされており、数億ドル単位の投資が当たり前だった従来のLLM(大規模言語モデル)開発と一線を画すコスト効率と言えます。

中国のスタートアップが桁違いとも言える低コストで欧米の最先端モデルに匹敵するAIを作り上げた、というニュースは、中国国内のみならずシリコンバレーの技術者や経営者からも称賛を浴び、瞬く間に世界的な話題となりました。

実際、DeepSeekのAIアシスタントアプリ(DeepSeek-AI)は米国App Storeの無料アプリランキングでOpenAIのChatGPTアプリを抑えて1位を獲得し、一般ユーザーからの注目度も一気に高まっています。

わずか創業半年ほどの無名だった中国企業が、AI分野で一躍トップクラスの存在感を示した

のです。

DeepSeek-V3とR1の革新性はどこにある?

イメージ

また、DeepSeek-V3の発表から間をおかず発表されたDeepSeek-R1は、推論時にCoT(※2)を行い、回答に至るまでの「考えた過程」を内部で保持します。これにより複雑な問題解決や論理的な質問に対しても、一段階ずつ理由付けしながら回答を導き出すことができます。

次のページ
1 2 3
岡田太一(sync.dev Technical Director/Visualization Artist)
岡田太一(sync.dev Technical Director/Visualization Artist)

CG会社のDigital Artist からキャリアを開始。ポストプロダクションを経て、現在はビジュアルクリエイティブ領域にてテクニカルディレクションを担当。得意な分野は映像編集、ビデオ信号とリアルタイム合成、トラッキング関連など。2022年から『ブレーン』で連載中。

岡田太一(sync.dev Technical Director/Visualization Artist)

CG会社のDigital Artist からキャリアを開始。ポストプロダクションを経て、現在はビジュアルクリエイティブ領域にてテクニカルディレクションを担当。得意な分野は映像編集、ビデオ信号とリアルタイム合成、トラッキング関連など。2022年から『ブレーン』で連載中。

この記事の感想を
教えて下さい。
この記事の感想を教えて下さい。

このコラムを読んだ方におススメのコラム

    タイアップ