ナレーターのオーディオブックはAI音声に代わられてしまうのか

デジタル書籍・AI・海外版権

先日のデジタルブックトピックスで、

Amazonのオーディオブックサービス「Audible」でナレーターが作成したAI音声レプリカを提供する試みがスタート(GIGAZINE)

という記事を紹介しました。これまで米アマゾンはAI音声の朗読については消極的な姿勢をとっており、KDPという著者が直接Kindle出版できるプラットフォームで発表された作品だけがAI音声朗読のオーディオブックを発表することができました。アマゾンが運営するaudibleでは、ACXというオーディオブック制作発表支援のプラットフォームでナレーターを選んだり編集したりという制作プロセスを支援しています。今回の発表についても、ACX上のサービスとしてナレーターのAI音声レプリカを選択できるようになるということです。

ナレーターが朗読したオーディオブックはなくなることはないと宣言したり、AI音声をKDP出版に限定したりと前向きな姿勢は見せずにきましたなが、記事を読むとすでに4万点のAI音声オーディオブックがリリースされているとのことです。点数的には、相当のペースだなと感じます。KDPがAI音声を「あり」にしたのは昨年末にニュースになりました。

ということは、今年に入ってから8月まで、均等割でも月5,000冊出ているわけですよ、週1000冊リリースですよ、消極的な数字とはいえませんよねえ。

数はそうなのですが、ベストセラーも出ているとはいえデジタルのみ、Kindleとオーディブルだけで出されているものが大半かと思いますので、アマゾン内での存在感は点数ほどはないのかもしれません。でも、これだけの数が実際に出ており、そしてナレーターの音声を学習させたよりリッチなオーディオブック制作環境も支援し、ということで来たるべき時に備えエネルギーを溜め込んでいるように感じられないこともありません。いい方がまどろっこしくてスイマセン。仕様です。

はて、日本はどうでしたか、ということですが、このブログで3月にこのような記事を書きました。

新書レーベルに限定して、ということで始まったようです。記事を書いたのは3月ですが、もう少し前から始まっていたはずですから、もう半年は経っていることになりますね。

最新のリリースで数を見てみましょう。オーディブルは、変わっていなければ金曜日に新刊がリリースされるのですが、最新の新着情報を調べてみました。

新着タイトル総数:67
肉声ナレーション作品:47
デジタルボイス作品:15

(ポッドキャスト作品等を除く)

結構デジタルボイス率高くないですか?当週新作タイトルの22%、しかもこれはKDPではなく出版社が出した本のオーディブル版です。実験、というよりはもう真正面からオーディオブックのラインナップとして構成されているようにも見えます。

このデジタルボイス作品の内訳ですが

フォレスト出版 6作品
ディスカヴァー・トゥエンティワン 5作品
PHP研究所 2作品
小学館 1作品
SBクリエイティブ 1作品

となっています。もちろん週によって点数のぶれはあるでしょうから一週だけを切り取って云々するのは乱暴ですが、一度に5・6作品のリリースはもう制作体制にのっとっているという理解でいいのではないかと思います。さらに、当初は新書だけだったジャンルの限定も、今回一部単行本が入っていました。区別がはっきりした新書を皮切りに、ノンフィクション全体まで広げていくのかな?とついまた考えが飛躍してしまいます。

日本では、先の米国でのリリースのようにナレーターの音声を学習して制作する、というニュースは聞こえてきません。水面下で話が出ているのかもしれませんが、ナレーター名は「デジタルボイス」だけで付加情報はありません。あくまでアマゾンが品質を担保して制作したAI音声オーディオブック、ということになります。日米でかなり方向性は違いますね。

違う国で、それぞれ実験をしているということかもしれません。またその一方で、各国のサービスの形が違うことからくる違いかもしれません。米国のオーディブルは、かつての日本のようなコイン制です。サブスクリプションサービスなのは同じですが、毎月コインがもらえて、そのコインを自分の好きなオーディオブック一冊と交換できるのです。この場合、ユーザーは「今月なにを聴こうかなあ~」とカタログをブラウズするとき、せっかくだったら人間のナレーターの方を優先するような気がするんですよね。心理として。私も米国民であったならばそちらになびくと思います。だから、ただのAI音声ではない、ナレーターの声を使用している、という付加価値が必要になるのではないでしょうか。

一方日本のオーディブルは聴き放題メインのサービスです。一定額で、聴き放題対象商品(感覚では90%以上は聴き放題対象では)は何冊でも聴くことができます。貧乏性の私などは、元を取ろうと(元って?)ガンガン聴いているわけです。この場合、デジタルボイスでもそんなに躊躇しません。気に入らなかったらやめて他の本に変えればいいだけです。それが、特に付加価値もつけず、現在ジャンルは限定的ではあるものの「普通の顔をして」デジタルボイス作品がリリースされている理由かもしれません。別の言い方をすれば、デジタルボイスでは聴かれないであろう文芸作品に人間ナレーターの資源を寄せて、情報重視のノンフィクションはデジタルボイスをどんどん作っていくという方向になっているのかもしれませんね。

結論めいたものはありませんが(すいません、そうなんですよ)、日米双方でデジタルボイスがそれぞれの方向で進化している、それぞれ出ているニュースから、それって私の単なる感想なんですが、考察してみた次第です。

先日ニュースまとめでも紹介しましたが、日本のaudiobook.jpも本人音声をベースにしたAI読み上げオーディオブックをリリースしています。こちらも一つの方向性ですね。

コメント

タイトルとURLをコピーしました