人工知能の分野では、先進的な大規模言語モデルの開発には莫大なリソース(技術的・財政的)が必要であるという一般的な認識があります。これが、アメリカ政府がドナルド・トランプ大統領の発表した5,000億ドル規模の「Stargate」プロジェクトを支援することを決定した主な理由の一つです。
しかし、中国のAI企業「DeepSeek」(ディープシーク)は、AI業界のあらゆる常識を変えました。2025年1月20日、DeepSeekは「R1」を発表しましたが、その開発コストは他の企業の製品開発費と比べてごくわずかでした。さらに、DeepSeekはR1をオープンライセンスで提供し、ユーザーが無料で利用できるようにしました。
リリースからわずか数日後、R1を搭載したAIアシスタントアプリ「DeepSeek」は、モバイル向けのチャットボットアプリとしてAppleのApp Storeランキングで急上昇し、OpenAIのモバイルアプリをも上回る人気を獲得しました。この爆発的な利用拡大と人気の高まりにより、2025年1月27日には株式市場で大規模な売りが発生しました。投資家たちは、Microsoft、Meta Platforms、Oracle、Broadcomといったアメリカの大手AI企業の評価に疑問を抱き始め、それらの企業の株価は大きく下落しました。
では、「DeepSeek」とは一体何なのでしょうか?本記事ではDeepSeekの各モデル、使い方、技術的詳細、「DeepSeekショック」などを徹底的に解説していきます。

DeepSeekとは何か?
DeepSeekは、中国の杭州市に本社を構える人工知能(AI)開発企業です。2023年5月に梁文峰(Liang Wenfeng)氏によって設立され、彼は浙江大学を卒業した経歴を持ちます。梁氏はまた、中国の量的投資ファンドであるHigh-Flyerの共同創設者でもあり、現在このファンドがDeepSeekを所有しています。現在、DeepSeekはHigh-Flyerの支援を受けながら、独立したAI研究機関として活動しています。ただし、同社の資金調達額や企業評価額についての情報は公表されていません。
DeepSeekは、オープンソースの大規模言語モデル(LLM)の開発に特化しています。同社の最初のモデルは2023年11月に発表されました。それ以来、コアとなるLLMの改良を繰り返し、さまざまな派生モデルを開発してきました。しかし、同社が世界的な注目を集めるようになったのは、2025年1月に推論型モデル「R1」を発表してからのことです。
DeepSeekは、自社のAIモデルを活用した多様なサービスを提供しており、その範囲にはウェブインターフェース、モバイルアプリ、APIアクセスなどが含まれます。
DeepSeekは日本語 に対応するか?
DeepSeekの公式サイトには中国はもちろん、英語という2つの言語を設定することができます。でも、Deepseekは多言語対応のAI技術を提供しており、日本語も対応しています。チャットボックスに日本語での質問や会話に対応できるよう設計されています。
DeepSeekの各AIモデルの進化
DeepSeekは2023年の創業以来、複数の生成AIモデルを発表してきました。各世代のモデルは、性能や効率の向上を実現しながら進化を続けています。
1. DeepSeek Coder(2023年11月)
- DeepSeekが最初に発表したオープンソースのコード生成AI。
- プログラミングタスクに特化したモデル。
2. DeepSeek LLM(2023年12月)
- 汎用的な大規模言語モデル(LLM)の初版。
- 幅広いタスクに対応するマルチパーパスAIとして開発。
3. DeepSeek-V2(2024年5月)
- DeepSeek LLMの改良版で、処理性能の向上とトレーニングコストの削減に重点を置いたモデル。
4. DeepSeek-Coder-V2(2024年7月)
- 2360億(236B)パラメータを持つ大規模コード生成モデル。
- コンテキストウィンドウ(入力可能なトークン数)は128,000トークン。
- より高度なプログラミングタスクに最適化。
5. DeepSeek-V3(2024年12月)
- 全く新しいアーキテクチャを採用した多目的AIモデル。
- 6710億(671B)パラメータの超大規模モデル。
- 128,000トークンのコンテキストウィンドウを持ち、幅広いタスクを処理可能。
6. DeepSeek-R1(2025年1月)
- DeepSeek-V3をベースに開発された、高度な推論(Reasoning)を強化したモデル。
- OpenAIのo1モデルと競争するレベルの性能を持つが、圧倒的な低コストを実現。
- 6710億(671B)パラメータ & 128,000トークンのコンテキストウィンドウを維持。
7. Janus-Pro-7B(2025年1月)
- DeepSeek初のマルチモーダルAI。
- 視覚データの理解と画像生成に対応。
- 70億(7B)パラメータを持ち、軽量ながら強力な性能を発揮。

DeepSeekは、オープンソースAIの開発を加速しつつ、高性能・低コストなモデルを提供することで、AI業界の勢力図を塗り替えています。
DeepSeek-R1の技術的特徴
DeepSeek-R1はの推論(Reasoning)能力の向上に焦点を当てています。OpenAIのo1モデルと競争できる性能を持ちながら、圧倒的な低コストで開発された点が大きな特徴です。
1. モデルアーキテクチャ
(1) 大規模Transformerモデル
- Transformerベースの自己回帰型(Autoregressive)LLMを採用。
- デコーダのみの構造で、自然言語処理(NLP)、コード生成、推論タスクに最適化。
- Mixture of Experts(MoE)技術を活用し、計算負荷を削減。
(2) 圧倒的なスケール
- パラメータ数:6710億(671B)
- コンテキストウィンドウ:128,000トークン
- GPT-4(最大32K)やClaude 3(最大100K)を超える長文処理能力。
- 大規模なドキュメントやプログラムコードの解析に適している。
2. トレーニング技術
(1) 高効率な強化学習(RL)
- 推論タスクに特化した強化学習を適用し、より論理的で整合性のある回答を生成。
- 教師あり学習 + RLHF(人間のフィードバックによる強化学習)を組み合わせた手法を採用。
(2) ルールベースの報酬設計(Reward Engineering)
- 従来のニューラルネットワーク報酬モデルに代わり、ルールベースの報酬設計を導入。
- AIの学習をより安定化し、推論精度を向上。
(3) 知識蒸留(Knowledge Distillation)による最適化
- 大規模モデルの知識を小型モデルに転送し、効率化を実現。
- 最適化された小規模バージョン(7Bモデル)も同時開発。
3. 計算リソースと最適化
(1) 少ない計算資源での効率的な学習
- DeepSeekは米国のGPU輸出規制の影響を受ける中、独自の技術で最適化。
- トレーニングに必要なGPU数を削減し、低コストで高性能なモデルを開発。
- 計算効率の最適化により、ハードウェア依存を低減。
(2) 分散学習とスパースアテンション
- 分散パラメータ最適化技術を導入し、計算リソースを最大限に活用。
- スパースアテンション機構で計算コストを抑えつつ、高精度を維持。
4. トレーニングデータと適用範囲
(1) 多言語対応
- 英語、中国語、日本語、ベトナム語を含む多言語対応。
- 各言語の自然な文脈を理解し、正確な翻訳や文章生成が可能。
(2) 広範な用途
- 推論(Reasoning):論理的な質問に対する高度な推論能力。
- コーディング(Coding):高度なコード生成やデバッグサポートが可能。
- ドキュメント処理(Document Processing):長文の要約、法律・金融文書の解析。
- 創造的なタスク(Creative Writing):ストーリー生成、コンテンツ作成に対応。
5. セキュリティと課題
(1) データセキュリティ
- DeepSeekは中国企業であるため、データのプライバシーやセキュリティに関する懸念が指摘されている。
- 企業向けの利用では、データの保存先や管理ポリシーが重要な検討事項となる。
(2) 地政学的リスク
- 米国政府は、中国のAI企業に対する規制を強化する可能性がある。
- GPU規制やAI技術の制限が、DeepSeekの成長に影響を与える可能性がある。
DeepSeekの料金
DeepSeek-R1の具体的な料金体系は、公式の情報や最新のアップデートに基づいて確認する必要がありますが、一般的なAIモデルやAPIサービスの料金体系に基づいて、以下のような要素が考えられます。
料金体系の種類
- 従量課金制: APIの使用量(リクエスト数やトークン数)に応じて課金される方式。
- サブスクリプション制: 月額または年額の固定料金で一定の使用量が提供される方式。
- 無料枠: 初期段階で無料で利用できる枠が提供される場合があります。
料金に影響する要素
- リクエスト数: APIへのリクエスト回数に応じて課金される場合があります。
- トークン数: 処理されるテキストの量(トークン数)に基づいて課金されることがあります。
- 機能の種類: 使用する機能(例: テキスト生成、翻訳、要約など)によって料金が異なる場合があります。
- サポートレベル: 優先サポートやカスタムサポートを利用する場合、追加料金が発生することがあります。
料金例(仮想)
- 無料枠: 月間1,000リクエストまで無料。
- 従量課金制: 1,000リクエストごとに$10。
- サブスクリプション制: 月額$100で10,000リクエストまで利用可能。
料金確認方法
- 公式ウェブサイト: DeepSeekの公式ウェブサイトの料金ページを確認します。
- ダッシュボード: アカウントを作成後、ダッシュボードから料金プランを確認できます。
- サポート: サポートチームに問い合わせて、具体的な料金を確認します。
注意点
- 利用規約: 料金体系や支払い条件は利用規約に記載されています。必ず確認してください。
- 追加料金: 使用量が無料枠やサブスクリプションの範囲を超えた場合、追加料金が発生することがあります。
DeepSeekの革新的なトレーニング・学習手法
DeepSeekは、OpenAIとは異なるアプローチを採用してR1モデルのトレーニングを行っています。この方法により、
- 学習時間が短縮され、
- 必要なAIアクセラレータ(GPUなど)の数が少なくなり、
- 開発コストが大幅に削減されました。
DeepSeekの目標は、AIの推論能力を向上させることであり、これによりAI分野の発展に大きく貢献しています。
DeepSeekは、R1の開発においていくつかの重要な技術革新を取り入れています。
1. 強化学習(Reinforcement Learning)
DeepSeekは、大規模な強化学習(RL)を適用し、特に推論に関連するタスクに焦点を当てています。従来のLLM(大規模言語モデル)よりも高度な論理的推論を実現し、より優れた意思決定を可能にしました。
2. 報酬設計(Reward Engineering)
DeepSeekの研究者たちは、ルールベースの報酬システムを構築しました。
- これにより、一般的なニューラルネットワークベースの報酬モデルよりも優れた学習が可能になりました。
- 報酬設計とは、AIが学習する際に望ましい行動を促すためのインセンティブ設計を指します。DeepSeekのアプローチにより、モデルの適応力と精度が向上しました。
3. 知識蒸留(Knowledge Distillation)
DeepSeekは、効率的な知識転移手法を活用することで、
- わずか15億(1.5B)パラメータの小型モデルに高度な能力を凝縮しました。
- これにより、リソース制約のある環境でも高性能なAIを運用できるようになりました。
4. 行動の創発的ネットワーク(Emergent Behavioral Networks)
DeepSeekの研究は、複雑な推論能力を持つAIが強化学習によって自然に発展できることを示しています。
つまり、明示的なプログラミングを行わなくても、AIが自ら高度な論理的推論を学習することが可能になりました。
5. DeepSeekの革新がもたらす影響
DeepSeekのトレーニング手法は、
・AI開発のコストを削減し、より多くの企業や研究者がLLMを活用できるようになる。
・AIの推論能力が向上し、より信頼性の高いモデルが誕生する。
・小型モデルでも高性能なAIが実現し、リソースに制約のある環境でも活用が可能。
DeepSeekのアプローチは、AI業界に新たな革命をもたらす可能性を秘めています。
DeepSeekショックとは?米国にとって脅威とされる理由?
DeepSeekショックとは、中国のAI企業「DeepSeek」が2025年1月に発表した大規模言語モデル「R1」の影響により、世界のAI業界や金融市場に引き起こされた大規模な変動を指します。
DeepSeekショックの発端
2025年1月20日、DeepSeekは「R1」という画期的なAIモデルを発表しました。このモデルは、従来の大規模言語モデル(LLM)と比較して、
- 開発コストが大幅に低い(既存の企業と比べて圧倒的に低コストで開発):DeepSeekは、R1の開発コストがわずか600万ドル(約9億円)未満と主張します。一方で、OpenAIやGoogle、Metaといった米国企業はAI開発に数十億ドル規模の投資を行っている。このコスト差により、米国企業のビジネスモデルが揺らぐ可能性が生じている。さらに、DeepSeekはOpenAIよりも安価なサービスを提供しており、米国企業の収益モデルを圧迫するリスクがある。
- 高い性能を持つ(推論・生成能力に優れ、最新のLLMと匹敵またはそれ以上のパフォーマンスを発揮)
- オープンライセンスで無料提供(企業や個人が自由に利用可能)
この発表により、AI市場の競争構造が根本から揺らぎました。
DeepSeekショックの影響
① AI業界への影響
- アメリカの大手AI企業(Microsoft、Meta、OpenAIなど)への信頼低下:これまで数十億ドル規模の資金を投入してきた企業が、DeepSeekの低コスト戦略に対抗できるのかという疑念が生まれた。
- AI技術の民主化が加速:OpenAIやAnthropicのような企業がAPI経由で提供していた有料AIサービスの競争力が低下し、無料・オープンソースのLLMの活用が一気に進むと予想される。
② 株式市場への影響(2025年1月27日の暴落)
DeepSeekの発表から数日後、R1を搭載したAIアシスタントアプリがAppleのApp Storeランキング1位を獲得し、OpenAIの公式アプリを超える人気を記録。この急激な変化が投資家心理に影響を与え、
- アメリカの大手AI関連企業(Microsoft、Meta Platforms、Oracle、Broadcomなど)の株価が急落
- 「AI市場の過大評価」が指摘され、大規模な売りが発生
- 新たなAI企業への投資シフトが進む可能性が浮上
この一連の流れにより、「DeepSeekショック」という言葉が生まれました。
DeepSeekショックの今後の展開
DeepSeekがAI業界に与えた影響は今後さらに拡大すると予想され、
- オープンソースAIの普及が加速(企業が自前のAIを持つ動きが活発化)
- AI開発の低コスト化・効率化の流れが強まる
- アメリカ企業のAI戦略の大幅な見直しが迫られる
DeepSeekショックは、AI市場のパワーバランスを大きく変える歴史的な出来事となるかもしれません。
DeepSeekの特徴
低コストで高性能なAIモデル
DeepSeekは、従来の大規模AIモデルよりも圧倒的に低コストで開発されており、
- R1モデルの開発コストは約600万ドル(他社の数十億ドル規模と比較して格安)
- 高い推論能力を維持しながら、低コストでの運用を実現
このコスト優位性により、企業や個人がAIを活用しやすくなっています。
オープンソースで無料提供
DeepSeekは、多くのモデルをオープンライセンスで無料提供しており、
- 商業利用可能なオープンソースLLM(大規模言語モデル)を開発
- 誰でもアクセスしやすく、カスタマイズや研究開発が可能
この点が、有料API提供を基本とするOpenAIやAnthropicとの大きな違いです。
AI開発の最適化技術(少ない計算資源で動作)
DeepSeekは、独自のトレーニング技術を駆使し、
- 従来より少ないGPUや計算資源で高精度なAIを学習可能
- 高度な知識蒸留(Knowledge Distillation)技術により、小規模なモデルでも強力な性能を発揮
特に、米国のGPU輸出規制下でも高度なAIを開発可能であることを証明しました。
128,000トークンの長いコンテキストウィンドウ
DeepSeekの最新モデル(DeepSeek-R1、V3)は、
- 最大128,000トークンのコンテキスト長を持ち、長文の処理が可能
- 高度な推論やコード生成に適している
これは、従来のGPT-4などのモデルと比較しても非常に優れた特徴です。
AI市場における地政学的インパクト
DeepSeekは、中国発のAI企業として急成長し、米国の技術覇権を脅かす存在になっています。
- 米国のAI企業(OpenAI、Google、Metaなど)のビジネスモデルに影響を与える
- 「AI版スプートニク・ショック」とも評される技術的進歩
- 安価なAI提供により、グローバル市場での競争を激化
>>> 関連記事:【完全版】AIエージェントとは?仕組み、メリット、活用事例、種類、作り方を徹底・生成AIとの比較
DeepSeekの使い方 PC、アプリ、API
DeepSeekはPCとアプリで使用できます。具体的に、DeepSeekを使用するには下記のいくつかの方法があります。
1. DeepSeekの公式サイトにアクセスする
・公式サイト:https://www.deepseek.com/ にアクセスする。
・「Start Now」をクリックする。

・ログイン画面にて「Sign up」をクリックする。

メールアドレスを用いて今後DeepSeekにログインしたい方は「Sign up」を選択してアカウント作成画面に移動します。
Googleアカウントにて今後ログインを行いたい方は、この画面で「Log in with Google」を選択してアカウント作成に進みます。
・チャットボックスに質問を入力し、Enterキーを押す。DeepSeekがすぐに回答を返します。

2. DeepSeek APIキーの取得方法
開発者向けに、DeepSeek APIキーの取得方法をご紹介します。
1. アカウント登録とログイン
・上記のように、公式サイト(chat.deepseek.com)にアクセスし、アカウントを登録する。
・登録完了後、ダッシュボードからAPIキーを生成します。DeepSeekのAPIキー管理ページにアクセスしてください。新しいAPIキーを生成します。

- ログイン後、「API管理」または「Billing(請求)」のセクションに移動する。
2. APIプランの選択
- DeepSeekは複数の料金プランを提供している場合があります。使用量やニーズに応じて適切なプランを選択します。
- 無料トライアルや従量課金制など、さまざまなオプションが用意されていることがあります。
3. 支払い情報の入力
- 選択したプランに基づき、支払い情報を登録します。
- クレジットカードやその他の支払い方法が利用可能です。
4. APIキーの取得と利用開始
- 支払いが完了すると、APIキーが発行される。
- APIドキュメントを参照し、適切なエンドポイントやパラメータを使用します。
5. 利用状況の管理と課金設定
- ダッシュボードでAPIの使用状況や請求額を確認できます。
- 必要に応じてプランの変更やAPIキーの再発行を行います。
注意:
・APIキーは個人用のセキュリティトークンです。他人と共有せず、安全に保管してください。
・支払い失敗や不明な請求がある場合、DeepSeekのカスタマーサポートに問い合わせる。
3.【2025年1月29日】Microsoft AzureでDeepSeek R1が利用可能に
2025年1月29日、DeepSeek R1がMicrosoft Azure AI Foundryで利用可能になりました。Azure AI FoundryのモデルカタログからDeepSeek R1を検索し、簡単にデプロイして使用を開始できます。

出展:azure.microsoft.com
まとめ
DeepSeekは、中国発の新興AI企業であり、オープンソース戦略と低コスト開発を武器に、急速にAI市場の強力な競争相手となりました。特に、圧倒的な低コストで開発されたR1モデルの発表は、世界中のAI企業に対し、戦略の見直しを迫る衝撃を与えました。
しかし、DeepSeekの急成長は、多くの課題も引き起こしています。米国の株式市場への悪影響や地政学的な懸念に加え、DeepSeekはOpenAIのような大手テクノロジー企業のビジネスモデルを脅かす存在となりました。それだけでなく、データセキュリティやサイバーセキュリティの観点からも新たな疑問が浮上しています。
同社は、高度なAIモデルを高価なリソースを使わずに開発できることを証明しましたが、一方でサイバー攻撃や機密データの漏洩といったリスクも、持続可能な成長の大きな課題となっています。
今後、OpenAIとDeepSeekをはじめとするAI企業間の競争は、AI業界の構造そのものを再定義していくでしょう。DeepSeekは、「低コストかつ高効率なAI開発が可能であること」を示す好例となるかもしれません。しかし、セキュリティリスクや国際的な政策による規制の壁を乗り越え、現在の地位を維持できるかどうかは、依然として不透明なままです。
レリパは、データ管理と分析からAI、プロセス自動化に至るまで、企業のデジタルトランスフォーメーションを加速させる包括的なソリューションを提供しています。最先端の技術を駆使し、ブロックチェーンからAI、さらには業界をリードするイノベーションを適用することで、メドテック、不動産テック、フィンテック、HRテック、ロジスティクス、小売・ECサイトなど、さまざまな業界において効果的な変革を実現します。
弊社は、お客様一人ひとりのニーズに最適化されたソリューションを提供し、業務効率の向上と競争力強化をサポートします。デジタル化の最前線で、ビジネスの成長を加速させるお手伝いをいたします。今すぐ、貴社の未来を形作るための最適なパートナーとしてレリパをお選びください。
「どのオフショア開発会社ごとに条件に合っているか確認するのは大変そうだ……」と思われた方は、ぜひRelipaにご連絡ください。
双方の間のミーティングとヒアリングを通して、貴社の開発条件にピッタリなサービスをご紹介いたします!お気軽にご相談いただけます!