今話題の中国発AI「DeepSeek」って何がすごいの?
低コストで実現した革新的技術が半導体市場を揺るがす - 時価総額91兆円の下落に見る業界の転換点
中国のAI企業DeepSeekが、約8億円という低コストで開発した画像生成AI「Janus Pro」と推論モデル「DeepSeek R1」を発表し、AI業界に大きな衝撃を与えている。
🚀 DeepSeek-R1 is here!
⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!
🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) January 20, 2025
革新的な技術開発
DeepSeekは、OpenAIの「o1」に匹敵する性能を持つR1を、わずか600万ドル(約9億3000万円)で開発。これはOpenAIの開発費のわずか3%程度とされる。特筆すべき点は、アメリカの輸出規制により最新GPUが使用できない中、旧型のNVIDIA H800チップ約2000個で開発に成功したことだ。
市場への影響
この発表を受け、世界の株式市場は大きく動揺。NVIDIAの株価は一日で約17%下落し、時価総額が約91兆円減少した。これは、Metaが2022年に記録した約37兆円の損失を大きく上回る、史上最大の下落となった。
技術的特徴と制限
R1の主な特徴は、以下のとおり。
- MITライセンスによる商用利用の自由度
- 70億パラメータという効率的なモデルサイズ
- App StoreでChatGPTを上回る人気を獲得
一方で、The Guardianの報道によると、天安門事件や台湾問題、ウイグル族に関する質問には中国政府の方針に沿った回答しか行わないなど、一定の制限があることも明らかになっている。
https://t.co/4cR4Xxgloc pic.twitter.com/7G3RPu7uT0
— ゆう🖱🐹💕🐰💻 ねとらじ代替サービスリリース (@mouse_soft_y) January 23, 2025
最新の動向
大規模なサイバー攻撃を被弾
2025年1月27日夜、DeepSeekは大規模なサイバー攻撃を受け、一時的に新規ユーザー登録を制限する事態となった。これに対しNVIDIAは「DeepSeekの推論実行には相当のNVIDIAチップが必要」と主張し、自社の価値をアピールする声明を発表している。
DeepSeekよりキャプチャ(1月28日 16時01分時点)
サイバーエージェントの日本語モデル開発
サイバーエージェントは2025年1月27日、DeepSeek-R1の派生モデルをベースに日本語で追加学習を行った大規模言語モデルを公開した。「DeepSeek-R1-Distill-Qwen-14B-Japanese」と「DeepSeek-R1-Distill-Qwen-32B-Japanese」の2つのモデルを、AI開発プラットフォームのHugging Faceで無償提供している。
【モデル公開のお知らせ】
DeepSeek-R1-Distill-Qwen-14B/32Bをベースに日本語データで追加学習を行ったLLMを公開いたしました。今後もモデル公開や産学連携を通じて国内の自然言語処理技術の発展に貢献してまいります。 https://t.co/Oi0l2ITzhh— サイバーエージェント 広報&IR (@CyberAgent_PR) January 27, 2025
このモデルは以下の特徴を持つ:
- MITライセンスによる商用利用の自由度
- 日本語での自然な推論や高度なタスク処理が可能
- 個人開発者から大企業まで幅広い層が利用可能
なお、サイバーエージェントは以前にもMetaのLlama 3.1の日本語追加学習モデルを公開するなど、AIモデルの日本語対応を積極的に進めている。
この日本語モデルの公開により、今後国内での活用事例が増加することが期待される。ただし、ユーザーデータの中国サーバーでの保存やセキュリティ面での懸念から、導入に慎重な姿勢を示す企業も存在する。
案の定、OpenAIからの不正入手疑惑が。
中国の機密情報収集ツールと思えばいいのかな。