『僕にはAIの言葉がわかる』その1:出版社はAI用フォーマットを用意しておくべき?

オーディオブックについて

僕にはAIの言葉はわかりませんよ

2025年に読んだ本の中で、興奮度、新鮮度が強烈だった自分の中の名著『僕には鳥の言葉がわかる』に敬意を込めてタイトルに練り込んでみただけです。僕にはAIの言葉がわかりません。一応先にお伝えしておきたいと思います。

AI時代に向けて、学習、対価還元、権利管理の課題

年末年始の時間を使って、AIとコンテンツの関係について書かれた一連のnoteのシリーズ記事を読みました。
池松さんという方による連載なのですが、AIによる学習、対価還元、権利管理といったテーマが、段階的に整理されていたものです。このブログでもご紹介してきたトピックではありますが、あらためて一つの切り口で構成されたものを読むと、これは「らしいよねー」と流してはおれないな、と感じました。ひとまずは、また完結したら読み返そうとざーっと流した次第です。

この連載は先日完結しましたのであらためて読み返しました。ウェブでこんなに長い文を読んだのは久しぶりでしたね。

読み始める前は、正直なところ、
AIに関する議論は重要ではあるものの、出版社として今すぐ何かを決めるという話はないしなあ、具体的な相談やオファーが大手さんにきたらその話を聞いてスタンスきいて、とかになるよなあ。
まあ、いつものやつです。

でもですね、一連の記事を通して、これは出版社に平等に、あるいは大手から、みたいに順序だって来ないかもしれんなあと思ったです。別業界ですし、出版社によって持ち物が違いますからね。


AIは何を学習したいのか

記事の中で繰り返し指摘されていたのは、AIが文章を単に読むのではなく、文体や構造、使われ方ごと学習する段階に入っているという点です。

これは、全文がそのまま再利用されるかどうかパクるとか真似する、という話ではありません。
文章がどのような構造で書かれているか、どんな語彙やリズムを持っているかが、AIの内部に蓄積されていく、という話です。

この前提に立つと、「読まれなければ影響はない」「売れていない本だから関係ない」といった2次利用的な感覚は、あまり意味を持たなくなります。

出版物は、読者に読まれる以前に、学習素材として取り込まれる可能性がすでにあります。日本は学習OKだから、そこは守りようがないもんねえ、困ったねえ、で済ませると本当に済んでしまう。


権利や交渉の主導権は、準備した側のもの

もうひとつ印象に残ったのは、AIに関する権利処理や対価還元の仕組みが、すでに動き始めているという事実です。

特に、プラットフォーム側が

  • 学習利用の可否を選択できる仕組みを用意し
  • 対価還元の枠組みを整え
  • 国際的な権利管理の場に参加している

という流れが、そこまできているようであります。ニュースは海外ばかりですが、日本に来ていないと誰がいえるでしょうか、いやいえない。

ここで重要なのは、
その是非を論じる以前に、一体誰しきりなんですかという点です。

構造化されたテキストを大量に持ち、
利用条件を機械的に管理できる側が、
先に枠組みを作り、条件を整えて先に話を進めていく。

出版社側が、
「自分たちのコンテンツを、どのような形で持っているのか」
「AIにどう使わせたいのか、使わせたくないのか」
「なんぼほしいんじゃ」(なんぼの価値があるんじゃ)
を説明できないままでいると、
後からFIXした選択肢が提示されるだけ、という立場になりかねない。

いや話来てねーし、で周回遅れも普通にあり得る。


問題は「食べさせるべきか」の前に、食べ物持ってるか

あと、もうひとつ。
出版社はそもそも、AIに渡せる形でコンテンツを持っているのか
という点です。

多くの場合、出版社が管理しているのは、

  • InDesignの印刷用データ
  • PDFやEPUBといった配布・販売用データ

これらは「読む」「売る」ためには十分ですが、
再利用や学習、条件交渉を前提とした形かというと、必ずしもそうではありません。

AIに学習させるかどうか、
対価をどうするか、
許諾するかしないか。

そうした判断以前に、
判断材料として出せるデータの形がないと、話が始まらない
ということでもあります。


まずは何ができるか何があるか

さて、何ができるか、するべきかで考えるとどうなるでしょう?

  • 今すぐAIに学習させる、前のめりで進めるかはまた別
  • 具体的なオファーがない段階で、細かい仕様をあらかじめ決める必要もないでしょう
  • ただし、そのために準備をするべきことがあるかは考えておいた方がいいのではないか

ここで言う準備とは、
AI向けに特別なデータを作ることではありません。仕様もわからないで作れるわけもないのですが。でも、AIが求めている、たとえていうなら食べやすい、消化しやすい形は知っておいた方がいいかもしれません。他でもないAIさんに、その辺どうなのと聞いてみますと。

  • 本文が構造を保った形で取り出せること
  • 見出しや本文が、機械的にも区別できること
  • 利用条件や判断を、後から付け足せる余地があること

そうした土台を持っておくことです。←と太字付きでいわれました。大事みたいです。


出版社として主導権を持つために

AIが情報を流通させるようになっても、
著者と読者の間に立ち、コンテンツを企画・設計する役割は、出版社に残る機能だと思います。

「売る」とか「守る」だけではなく、
「どういう形で持ち、どう使わせるかを説明できる」というディレクションを、読者同様、AIに対してもできるようになると、その情報がAIにとっても「価値あるもの」になるのではないか、と思います。出版社のミッションが情報の価値を最大化して適切に配布するということであるならば、読者としてのAIに対してもその前提のもとに対峙できるはずです。

最後にいうのもなんなんですけど、このエントリは個人的な見解でございます。
AIに食わす、いや食わさんの「べき論」を云々するわけではございません。
相手について知っておいて準備しておくことは大事かもしれん、という思いから、このような領域で話し合える糸口になればいいなあという、お友達募集の目論見もあります。

続きます。

コメント

タイトルとURLをコピーしました