Original Script: https://www.youtube.com/watch?v=FMU0j_ly4kk
「DeepSeek が今、アメリカのテック企業に圧力をかけています。本当に驚異的です。中国の開発にはとても注意を払うべきだと思います。DeepSeekは、これまで考えられていたよりも必要なものが少ないことを示してくれました。かつて思っていたほど多額の資金は必要ないのです。想像してみてください。自分が 5,000 万ドル(約 50 億円)かけて家を建てたのに、お隣さんは同じ家を 70 万ドル(約 7,000 万円)で建ててしまうんですよ。イライラするに決まっていますよね。これは産業界に対する警鐘であり、集中して取り組む必要があるということです。まさに『必要は発明の母』なのです。
2024年12月、中国の小さなスタートアップがAI界を揺るがすブレイクスルーを起こしました。テックジャイアントに挑戦し、AIを再定義する出来事でした。その名は DeepSeek。あまり知られていない企業でしたが、V3モデルで大きな波紋を広げました。このモデルは、たった 2,000 枚の低スペックな NVIDIA H800 GPU を使っただけで、コーディングや論理的推論、数学において多くのトップモデルを凌駕したのです。この成功はシリコンバレーに衝撃を与え、AI開発のアプローチを再考させるきっかけとなりました。
この偉業の背後にいたのが、やがてテック界を魅了する存在となる謎の人物、リャン・ウェンフォン(Liang Wen Fung)です。1985年、彼は中国の広東省の沿岸都市、ジャンシャン(Jiangxiang)で生まれ、父親が小学校教師という質素な家庭で育ちました。幼い頃から数学の才能を示し、他の子どもがゲームやスポーツに熱中するなか、彼は何時間もかけてパズルや方程式を解き、その秘密を解き明かす楽しさに浸っていました。この数字への愛着こそが、彼のキャリア全体を形作ることになるのです。
10代に入る頃には、リャンの問題解決力は群を抜いていました。複雑な課題を小さなステップに分解して考える力があり、それは後にテックや金融の実社会の問題を解決するのに大いに役立ちました。17歳で、彼は中国屈指の名門校であるジャン大学(Jiang University)に入学し、電子情報工学を学びます。数学の才能を活かしつつ、実際の技術に触れる日々でした。
大学在学中、リャンはデータ分析やコンピュータシステムなどに没頭し、数学が金融市場をどう説明し得るかに強い興味を抱きました。確率モデルやアルゴリズムを学び、市場のトレンドを予測しようと試みました。教授陣からその才能を注目され、高度なプロジェクトや研究の機会を与えられます。卒業間近にはアルゴリズム取引にフォーカスし、コンピュータプログラムを使った高速かつ数値駆動の株式売買戦略の開発に打ち込みます。これが後の彼のキャリアの土台となりました。
ちょうどその頃、リャンは大きな選択を迫られます。ドローン企業 DJI の創業者であるワン・タオ(Wang Tao)から共同創業者としてのオファーがあったのです。財を得るチャンスは大きかったものの、彼はこれを断りました。リャンは、AIがドローン業界をはるかに超えてさまざまな産業を変革すると信じていたからです。DJI への参加を断り、彼は独自に AI 主導のソリューションを切り拓くための起業を選びました。
2008年の金融危機が世界の市場を揺るがしていた頃、ジャン大学の大学院生だったリャン・ウェンフォンは、自身の技能を試すチャンスだと捉えました。銀行の破綻や経済の混乱により大半の人がパニックに陥る中、彼は数学的専門知識を武器に問題解決に取り組みます。彼はクラスメイトを集めて機械学習――データから学習するAI――の研究を始め、目的は人間より速く、より賢く市場を分析できるプログラムを作ることでした。
このアプローチ、いわゆるクオンツトレーディング(定量的取引)は、株価や経済指標、世界的なトレンドといったデータからパターンを見出すための数学モデルに依拠します。彼らのチームは株価や失業率、ニュースの見出しなど膨大なデータを集め、それらを実験的なアルゴリズムに投入し、予測を洗練させていきました。しかし、危機のさなかで経済が激変する中、初期モデルは次々と失敗しました。
「投資家のパニックも加味してみては?」というリャンの提案のもと、彼らは深夜までコードを書き続けながらモデルを改良し、人間の予測不可能な行動を織り込むことに挑戦。少しずつアルゴリズムは、伝統的なトレーダーが見落としていた隠れたトレンド――たとえば住宅価格下落がテック株にどう影響するか――などを見つけられるようになりました。試行錯誤を重ねた末、そのシステムは完璧ではないものの、変動の激しい市場の中で正確な予測をし始めます。たとえばある銘柄が反発する兆しをいち早く察知し、小さくとも有益な成果を得ることに成功。こうした成功例はジャン大学で注目され、AIが金融を変えうる証拠として評価されました。
2009年ごろにはウォール街をはじめとする金融センターもクオンツトレーディングを取り入れ始め、リャンの先見性が実証された形となりました。彼のプロジェクトは「危機の中で生まれたイノベーション」の事例として認められ、数学・テクノロジー・粘り強さの融合が成果をもたらすことを証明したのです。彼は数年前に DJI のオファーを断りましたが、この経験を通じ、AI が金融にとどまらずあらゆる産業の未来となるという信念をさらに強くしました。
2013年、リャン・ウェンフォンは大学の友人であるシュ・ジン(Xu Jin)とともに「Hung Xo Jacobe Investment Management(洪Xoジャコベ投資管理)」を共同設立し、AIを使ったトレーディング戦略を本格的に市場で試し始めます。そこから2年後の2015年、二人は「Hungo High Flyer Technology(洪高ハイフライヤー・テクノロジー)」を立ち上げ、高度な数学とAIを組み合わせてよりスマートなトレーディングシステムを開発することに注力しました。
当時、中国の金融市場は拡大を続けており、ハイテク志向の企業にとっては新たなビジネスチャンスが生まれていました。ハイフライヤーは2016年、初のAIトレーディングモデルをリリースします。これは従来型とは異なり、大量のデータを分析して自動的に学習する「ディープラーニング」を導入し、株式売買の判断を下す仕組みでした。その成果は目覚ましく、2017年前半の変動が激しい相場でも安定した利益を出し、他社が損失を被る中でも好調を維持したのです。
成長は爆発的でした。2016年末には運用資産が10億元(約1億4000万ドル)を超え、老舗のライバル企業をしのぐ勢いとなります。特筆すべきは2015年に 1 日で 10 本の投資商品を立ち上げ、大量の資金調達を可能にしたことです。こうした迅速な資金集めとイノベーションへのこだわりが、常に最先端のアルゴリズムを維持する原動力になりました。2019年までに、ハイフライヤーは中国の「ビッグ4」クオンツ企業の一角を占めるまでになり、自国企業が最新技術を用いて世界と戦えることを証明しました。しかし、リャンにとってはこれも通過点にすぎず、金融を超えてさまざまな産業を変革するという大きなビジョンに向けた第一歩でした。
ハイフライヤーが成長する中、リャン・ウェンフォンには大きな課題がありました。同社のAIトレーディングシステムを競合に先んじて維持するには、膨大な計算リソースが必要だったのです。2019年、彼は大胆な投資に踏み切り、2億元(約2,800万ドル)を投じて「Firefly Number One(ファイアフライ・ナンバーワン)」という大規模AIトレーニングシステムを構築します。これは1,100枚の特殊GPUを搭載し、金融データを高速で処理してより賢明な取引を可能にしました。
しかし、リャンはさらにその上を行きます。2021年には 10 億元(約1億4,000万ドル)という驚くべき金額を追加投資して「Firefly Number Two(ファイアフライ・ナンバーツー)」を完成させました。これは NVIDIA のハイエンドGPU A100を 10,000 枚搭載するもので、その演算能力は高性能ノートPC 10万台分に匹敵すると言われています。金融企業はもちろん、中国においてもこれほど先進的なシステムを構築したケースは極めて稀でした。
Firefly Number Two は単にパワフルなだけでなく、環境面でも先進的でした。従来型と比べてエネルギー使用を 40% 削減し、コストも半分ほどに抑えたのです。これは冷却技術の改良やエネルギー効率を高めるデザイン、GPU間のデータ転送を高速化するカスタム部品の採用によるものでした。こうした工夫により、ハイフライヤーは莫大な電力消費やコストをかけずに、大規模なAIモデルをトレーニングできるようになったのです。そして、この Firefly システムは当初は株式市場予測のために作られたものの、やがて金融を越えたAIの課題にも取り組むための基盤となっていきます。
2023年5月、リャン・ウェンフォンはさらなる大きな勝負に出ます。金融から一歩進み、「汎用人工知能(AGI)――チャットボットや画像生成だけでなく、コードを書いたり病気を診断したりと、人間の多くの能力を上回るAI――」を目指すというものです。多くのAIツールは特定用途に特化していますが、AGI は人間のように学習し、適応することを目指します。
2023年7月には、リャンは新たに「DeepSeek(ディープシーク)」というスタートアップを立ち上げ、「人間レベルのAI」を作るという大胆なミッションを掲げました。中国のビッグテック企業がAI覇権を競う中、DeepSeek は彼らと正面から競合する形となりました。しかし、リャンには勝算がありました。短期利益を追うのではなく、若い才能に投資する道を選んだのです。トップ校の新卒や社会経験1~2年の若手を積極採用し、その未成熟ながらも柔軟な頭脳に賭けました。DeepSeek はメディア向けのアピールを極力避け、長期的な研究開発に専念。その小ささこそが強みでした。「大企業は巨大なタンカーのようで力はあるが方向転換が遅い。一方、私たちはスピードボートです」とあるエンジニアは語ります。
DeepSeek が強みとしたのは、大きく二つ。リャンが金融時代に構築した Firefly スーパコンピュータを使えること、そしてオープンソースの理念を活用し、世界中の研究者と協力できるツールを提供することでした。
そして2024年5月、DeepSeek は衝撃的なニュースを発表します。それが DeepSeek V2 でした。このAIモデルは OpenAI の GPT-4 Turbo クラスの性能を持ちながら、コストは 70 分の 1、すなわち 100 万単語処理あたり わずか 1 元(約 20 円)にまで削減したのです。これは安さだけでなく、AI業界の常識を覆す一大事件でした。
DeepSeek V2 では、以下の2つのブレイクスルーを組み合わせています。ひとつは「multi-head latent attention」という新手法で、情報処理を大幅に高速化し、必要な計算資源を削減することに成功しました。これは数年前から多くの研究者が目指してきた「少ないリソースで高性能を実現する」上で大きな進展でした。
もうひとつは「mixture of experts」という仕組みで、質問内容に応じて特定の“専門家モデル”だけを起動するというものです。例えば「金融」に関する質問なら金融担当のモデルだけを動かし、他は休止させます。こうしてシステム全体をフル稼働させる必要がなくなるため、大幅なコストダウンが可能になりました。企業はこの仕組みを活用して価格を下げ、中小企業やスタートアップでも手が届くAIソリューションを提供できるようになったのです。アナリストはこれを「AIの民主化」と呼び、多額の予算がないと先端技術を作れないという神話を崩したと評価しました。
さらに DeepSeek V2 は、環境にもやさしい設計が注目を集めました。より少ない計算資源でモデルを動かせるため、データセンターの膨大な消費電力という問題を緩和する効果が期待されたのです。エッジコンピューティングやモバイルデバイスなど、従来の大規模インフラがない領域でも活用が見込まれました。大手企業に比べてはるかに小規模な DeepSeek が、独自の発想と技術力でここまで迫れることを証明したことは、業界に大きなインパクトを与えました。
2024年12月26日、DeepSeek は画期的なAIプロジェクトを発表します。それが DeepSeek V3 でした。今回の大きな驚きは、最新モデルを「基本的なハードウェア」だけで完成させたことにあります。DeepSeek V3 は、わずか 248 枚の NVIDIA H800 GPU しか使わず――AI開発としては一般的に「ローエンド」と見なされる設備――それでも強力なハードウェアを大量に使っていた従来のモデルを凌駕する性能を実現したのです。
DeepSeek V3 は、コーディング・論理的思考・数学といった分野で高い評価を受け、OpenAI の GPT-4 に匹敵する性能を示しました。OpenAI を立ち上げた中心人物の一人であるアンドレイ・カルパシ(Andrej Karpathy)も、限られたリソースでこれほどの性能を引き出したことに驚嘆を示しています。そのうえ、DeepSeek V3 の学習コストは約 5.58 億元(約 7,700 万ドル)と推定され、GPT-4 の 6,300 万〜1 億ドルという推定コストに比べても大幅に安価でした。つまり、莫大な資金と計算資源がなくてもトップクラスのAIを作れることを証明したわけです。
DeepSeek V3 の成功を支えたのは、FPA ミックスドプレシジョン・トレーニングや複数トークンを同時に予測する新技術など、「効率を極限まで高める」工夫の数々でした。その結果、トレーニングにかかった GPU 時間は約 280 万時間(= 248 GPU × 総トレーニング時間)に過ぎず、たとえば Llama 3 は 3,080 万 GPU 時間を要したと報告されており、いかに効率が高いかが際立っています。これはまさに「小さなエンジンと少ない燃料で、F1 レースカーを抜き去る」ようなインパクトであり、AI研究者たちにとっては衝撃的な出来事でした。
この成果により、大規模な予算やハイエンドGPUを前提としない開発手法が注目され、多くの研究機関や企業が自分たちにもチャンスがあると認識するようになりました。DeepSeek の成功は単に技術力の高さだけでなく、その運営スタイルにも秘密がありました。複雑なプログラムや強力なハードウェアだけではなく、そこに携わる「人」がイノベーションを形にしたのです。
DeepSeek が注目された理由の一つは、少数精鋭かつ若いチーム編成でした。同社にはエンジニアと研究者が合わせて 139 名しかおらず、競合である OpenAI の 1,200 名を超える研究者数と比べてもはるかに小規模です。業界の常識では「大きいほど強い」という考え方が根強い中、これは異例でした。
リャン・ウェンフォンは、チーム作りにおいて独特のアプローチを取りました。彼が重視したのは、優秀だが経験が浅い人材――特に大学を出たばかり、あるいは入社 1~2 年程度の若者――を発掘すること。清華大学や北京大学などのトップ校から若い才能を積極的に採用し、経験よりも潜在能力を重視しました。これはリスクも高い一方で、大胆な発想とスピード感あるイノベーションをもたらします。
同社は階層型の管理をほとんど設けず、意思決定も早く、一人一人が主体的に動ける環境を整えています。「現場主導型」とも呼べる組織づくりで、社員それぞれが自分に合った役割を自然に見つけて成長していけるような設計になっていました。管理のレイヤーを減らすことで、若い研究者は遠慮なくアイデアを出し、すぐに実行に移せます。官僚的な手続きや書類仕事に時間を奪われないため、新しい概念や技術は素早く現実の形となりました。
このような新勢力の台頭により、多くの大手企業が計画や資金配分の見直しを迫られました。Scale AI の創業者アレクサンダー・ワン(Alexander Wang)は率直な感想を述べ、「DeepSeek の成功はアメリカのテック企業にとって辛い現実を突きつけた。米国は安逸を貪るうちに、中国は安く速い方法で大きく進歩していた」と語りました。これは世界のAI競争が転換期を迎えていることを示すものであり、大手各社にとっては油断できない状況であることを改めて認識させるものでした。
投資家として著名なマーク・アンドリーセン(Marc Andreessen)は、DeepSeekが公開した「R1」を「これまで見た中でも屈指の驚くべきブレイクスルー」だと評し、しかもそれがオープンソースで公開されていることに感銘を受けたと述べています。アンドリーセンの言葉は、DeepSeek の新しい手法が技術だけでなく、AI企業のビジネスモデルをも変え得ることを示唆していました。コミュニティ全体が「DeepSeek の功績が市場をどう揺さぶり、大手プレイヤーである OpenAI やMeta、その他をどのように脅かすのか」に注目し始めたのです。
私たちが見ているのはこういうことです。
中国はいつまでも「フォロワー」の立場にとどまるわけにはいきません。
よく「中国のAIはアメリカより1~2年遅れている」と言われますが、
本当の隔たりは独創性と模倣の違いにあります。
これが変わらなければ、中国は永遠にフォロワーのままです。
だからこそ、いくつかの探求は避けられず、逃げることもできません。
私たちは、経済が成長するにつれて、
中国は他人の努力にばかり頼るのではなく、
貢献者として新たな役割を徐々に担うべきだと考えています。
この30年間、私たちは主に傍観する側にまわり、
大きな技術革新に十分にかかわってきませんでした。
しかしこれからは、イノベーションはますます広がっていくでしょう。
今はまだ理解しづらいかもしれませんが、社会は事実を知る必要があります。
今日の社会では、イノベーションを推進する人々が成功を収め、
集合的な思考がさらに発展します。
私たちに必要なのは、事実と明確なプロセスだけなのです。