数百万冊の本が学習され、市場から43兆円が消えた問題を出版目線で整理したらやっぱいかんわ

デジタル書籍・AI・海外版権

池松さんが追いかけている記事を年末から読んでいて、とはいえできることはどこなのだろう。など考えていて、出版社としてはテキストのAI最適化対策からかななどと考えていました。勢いで色々書きました。

池松さんの最新の記事はこちら(池松さん池松さんいってますけど面識はないです)。この一連の記事の情報をもとに、考察したいと思います。
プロジェクト・パナマって聞いちゃうと脳内はヴァン・ヘイレンの「パナマ」がなってしまうのです。今ライブ版を聴きながら書いています。


さてその流れで本題です。先週米国の市場に大きなショックが走りました。
アントロピックのAI法的ツールのリリースが欧州のデータ企業の株価に打撃を与える」(the guardian)

43兆円。これは2026年2月3日、米国のソフトウェア関連株から吹き飛んだ時価総額の数字です。

震源地はAI企業「Anthropic(アンソロピック)」が発表した新機能でした。このニュースは、単なる株式市場の調整ではありません。AIサービスのゲームチェンジが始まったというような表向きの理由とともに、出版社やコンテンツホルダーにとって、「知識の価値」がどのように扱われ、誰が利益を得ているのかという構造的な歪みを突きつける象徴的なニュースだと感じました。

今回は、この市場の動揺を入り口に、AIビジネスの裏側にある問題と、出版社などのコンテンツホルダーが直面している(するであろう)危機について整理します。

1. なぜこのインパクトが走ったのか:AIは「助手」から「代行者」へ

これまで市場は「SaaSサービスにAIが組み込まれれば、より便利になる」と楽観視、というか期待をしていました。しかし、Anthropicが発表した「Claude Cowork」とそのプラグインは、その前提を覆しました。Anthropicがすでに上場していればまた違う動きになったかもしれませんが、未上場であったこともあり、マイナスだけが見える化されたといえるかもしれません。

  • 衝撃の理由: これまでのAIは人間をサポートする「アシスタント」でしたが、今回のツールは人間を介さず、法務チェック、経理処理、データ分析といった「実務を完結させる同僚(Coworker)」として登場しました。
  • 市場の恐怖: 「AIが勝手に仕事をするなら、月額課金の会計ソフトも、高額な専門データベースの契約も、そもそも人間がログインする必要もなくなるんじゃね?」と投資家たちは気づいてしまいました。

結果、トムソン・ロイター(法律)やRELX(学術・実務)といった「専門知」を売りにする企業の株価が急落しました。これは、AIがこれまでいわれてきたように「人間の仕事を奪う」だけでなく、「専門情報のビジネスモデルそのもの」を破壊し始めたことを意味します。米国でのサービスリリースでしたが、すぐに日本の市場も連鎖反応し、SaaSサービス全面安になりました。

2. 収益モデルの錬金術:タダ同然の原料を使って全世界で売る

ここで冷静に考えなければならないのが、このAIが生み出す「莫大な利益」の源泉です。

AI企業は、弁護士や会計士レベルの高度な判断能力を持つAIを「エンタープライズ(企業)向け」に高値で販売し、巨額の収益を上げようとしています。見込まれた利益は、今回市場から失った金額に呼応するぐらい巨大なものです。しかし、そのAIを賢くするための「原材料(学習データ)」には、適正なコストが支払われていないのではないでしょうか。

これが今回の騒動で浮き彫りになった「錬金術」のようなビジネスモデルです。 「出版社がコストと時間をかけて作った高品質な知識を、タダ同然で吸い上げ、それを加工して世界全体にサービス展開する」。この利益率の構造こそが、権利者が直視すべき問題です。

例えばですが、この自炊や海賊版の仕入れに1兆円かかったとしましょう。それを使って作ったサービスが、市場では43兆円の価値があると見積もられた、ともいえるわけです。価値を試算されたわけではないですけど、それぐらい市場にはインパクトを与えたわけです。情報を取り扱うという意味では一緒ですが、これまでのIT会社の広告ビジネス等とは本質的に違うのがこの部分ですね。

3. サービスが成り立っている条件:極秘計画「Project Panama」

AIは独学で賢くなったわけではありません。物理的な「盗掘」が行われていました。 裁判資料で明らかになったAnthropicの「Project Panama」の実態は衝撃的です。

  • 物理的な裁断とスキャン: 市場から数百万冊の本を買い集め、背表紙を断裁機で切り落とし、高速スキャナーで読み込ませていました。
  • 海賊版の利用: 経営者レベルで、海賊版サイト「Library Genesis」から書籍データをダウンロードし、「やったぜ!(just in time!!!)」と喜んでいたことまで露見しています。
  • なぜ「本」なのか: ネット上の文章はノイズが多いですが、書籍は編集・校正された「論理的でクリーンなデータ」だからです。

現在の高度なAIサービスが成り立っている必須条件は、出版社の資産である「書籍」だったのです。もちろんこれら書籍だけをAIが学んだわけではないでしょう。それが総学習素材のどれぐらいを占めたのかは当然ながらわかりません。

4. フェアな条件とは:過去の清算と未来の契約

市場がパニックになるほどの価値を生むAIなら、その元となったデータに対しても「フェアな対価」が支払われるべきです。でないと、「おいしすぎ」ではないですか。今後の「適正な条件」として少なくとも以下の2つの要素は必須だと考えます。

  1. 「学習」と「利用」の分離: 自然な言葉遣いを学ぶ「学習」と、専門知識を引き出すための「参照(RAGなど)」を分け、特に後者の「知識の商用利用」に対してはライセンス料を支払うビジネスモデルへの転換が必要です。
  2. オプトアウトと許諾の権利: 著作者や出版社が「自分の本をAIの学習に使わせない」と拒否できる権利、あるいは「条件付きで許可する」権利を実質的に行使できるパートナーシップ的・技術的な仕組みが不可欠です。

「AIは学習したものからできている」という前提をはっきりさせた上で、その情報の価値創造を尊重して頂かないと。アスリートが食べるものを大事にしてこだわるのと同じですよね。これまでの学習の被害の清算も可能なら、と思いますが少なくともこれからは正規ルートでフェアトレードが必須ですね。

5. 日本語の出版社としての課題:言語主権の危機

最後に、日本の出版社特有の課題があります。

  • 和解の蚊帳の外: 現在の米国の集団訴訟の和解案では、補償対象は「米国著作権局に登録された書籍」に限られています。つまり、日本の書籍は「盗まれ損」の状態です。
  • 日本語の情報ルートができていない。これは日本語や日本のローカル情報が十分に備えられたAIがないのではないか、ということもありますし、また供給ルートが整備されていないということもあります。これでは専門AIのエンジンが動きません。

結論として 今回の株価ショックは、「AIバブルの崩壊」ではなく、「AIによる搾取構造」が可視化されたといえるのではないでしょうか。 出版社は、単に被害を嘆くだけではなく、「編集された知識」こそがAIにとって最も高価で不可欠な資源であることを自覚し、安売りせず正当な権利を主張していく必要があります。整備網やルールに関しては企業単位ではなく共通のプラットフォームなどが必要だと思いますが。

コメント

タイトルとURLをコピーしました