新聞協会は、現在の著作権法のなかのAI開発を促進する規定(第30条の4)をいじって、AIの学習データに新聞記事を自由に使わせないようにすることを主張しはじめている。

新聞協会がそういう姿勢なので、新聞各紙もその主張に沿って、AIによる著作権侵害の危機をあおる報道をする傾向が出ている(たとえばこれ)。

この件については新聞社は利害関係者であり、自分たちの主張に世論を誘導しようとしている。新聞報道を批判なく受け取るのは危険だ。

2023年10月16日の文化審議会著作権分科会法制度小委員会で、新聞協会からの意見陳述があった。わたしは傍聴を申し込んだつもりだったのだが、何かミスったみたいで傍聴URLが届かなかったので、資料を頼りに書いていることをお断りしておく。

その陳述のなかで、Bing AIが2023年8月10日の讀賣新聞の記事をこのように「複製」していると、元記事との対照表を掲げて主張している。

日本新聞協会提出資料の4枚目

これをみて疑問に思ったのは、AI が生成した文章のうち元記事とおなじだとされる箇所(赤字部分)に著作物性があるのか? これらは著作権で保護される「思想又は感情を創作的に表現」したものか? たんなる「事実」や「創作的とはいえない表現」ではないのか? さらには、似たような文章が元記事以前のほかのソースにもあるのではないか? ということだ。

赤字部分を順にみていくと。


1行目:

「平安時代」「日本の南の空に」→「事実」でありプロンプトの反復京都千年天文学街道 2013年8月19日の記事に「寛弘三年四月二日(1006年5月1日)の深夜、南の低い空に出現した大客星です」の記述あり)。

「突然現れた客星」→「事実」でありプロンプトの反復Wikipedia「かに星雲」の項に「客星(突然現れた明るい星)」の記述あり)。

「1000年[以上]前」→「事実」でありプロンプトの反復AstroArts 2008年7月4日の記事に「1000年後の現在」の記述あり)。

「数ヶ月間」→「事実」sorae 2018年11月23日の記事に「西暦1006年の夜空には数ヶ月の間、最大-7.5等という明るい天体が夜空を照らしたと言います」の記述あり)。

「人々を驚かせ」→「事実」とはいえないが「創作性」は低い長崎大学・後藤氏の1992年の論文に「1054年 の「客星」について「当時の人々を驚かせたようである」の記述あり)。

「中国やエジプトなど」「記録され」→「事実」(AstroArts 2008年7月4日の記事に「1006年の5月1日ごろ、深夜の南天にひじょうに明るい星が出現したことが、日本や中国、エジプト、ヨーロッパなどの記録に残されている」の記述あり)。

「現代の科学者」「宇宙の[起源]」「手がかりとして注目」→「事実」とはいえないが「創作性」は低い。

2行目:

「藤原定家が」「「明月記」に」「1006年4月2日」「南」「[大犬]座の方向に」→事実(weblio「寛弘期におきた出来事」の項に「寛弘3年(1006年)4月2日、おおかみ座に超新星 (SN 1006) 出現。明るさは日月を除いて史上最高の-9等級と推定される。後世、藤原定家が『明月記』に記録」の記述あり。「おおかみ」が「大犬」に変換されている。「おおかみ座」が「南」にあることはコトバンク「おおかみ座」の項にあり)。

「明る[く]」「火星の[ように]輝き」→事実「天文月報」2006年7月の記事に「明るい客星が現れ、螢惑(火星)のようだった」の記述あり)。

「客星の黄色[い]光」「中国の歴史書」「天文官僚」「「吉兆」」「皇帝に[報告]」→「事実」Wikipedia「SN1006」の項に「中国大陸の歴史書には……官僚の周克明(天文を司る職掌の司天監丞などを歴任した)が……黄色い色で強く光り輝くこの星を、国に繁栄をもたらす吉兆星であると皇帝に説明したと記されている」の記述あり)。

3行目:

「エジプトでは「月の4分の1ほど」、イエメンでは「水面がぎらぎら輝き太陽のよう」と様々な表現で記録され、当時の人々が驚く姿が目に浮かぶ」→AIは「複製」していないが京都大学のサイトに「エジプト: 1/4の月より少し明るかった」「イエメン: 水面がぎらぎら輝き太陽のようだった」とあるので、元記事はこういったものを参照した可能性がある。

4行目:

「超新星」「星が寿命を」「爆発し」「大量の元素を[放出し]ながら光を放[出]」→事実国立天文台 2015年9月7日の記事に「質量の大きな恒星は一生の最後に超新星爆発を起こし、内部で生成した重元素を宇宙空間に撒き散らします」の記述あり。超新星爆破が光を放つ場合があるのは常識の範囲)。

「現代では[、]「SuperNova」[と「1006年]を組み合わせて「SN1006」と呼ばれ」→「事実」sorae 2018年11月23日の記事に「超新星(SuperNova)を西暦1006年に起こした天体として「SN 1006」と名付けられています」の記述あり)。

「月[と]太陽[以外では歴]史上最も[輝かしい]天[文]現象」→「事実」京都千年天文学街道 2013年8月19日の記事に「太陽と月を除けば人類観測史上最も明るい天体です」の記述あり)。

5行目:

「爆発」「残[留]」「今[で]も数百万度以上[の]温[度]」「火球(星雲)」「宇宙を漂」「秒速数千キロメートルで」→「事実」gendai.media 2021年4月30日の記事に「その爆発はすさまじく、数100万℃の巨大な火の玉となって、秒速数1000 kmという途方もないスピードで宇宙空間を膨張します」の記述あり)。

6行目:

「京都大[学を]中心とするチーム[は、]SN1006を研究」「爆発」「元素」「詳しく」→「事実」(京都大学の2013年7月2日のリリースから生成可能と思われる)。

「[でき]れば、宇宙物質の起源[についての手がかりを]得る[ことができるかも]」→「事実」とはいえないが「創作性」は低い。


こんな具合なので、AIの文章は讀賣新聞を「複製」しなくても、オープンなソースから生成できる可能性がある(ただし、Bing AIは引用元を讀賣新聞と明示しているので「複製」はしているのだろう)。

新聞報道は、基本的には「事実」を伝えるものだから、社説・論説類を除けば、文章の要素にAI生成物や他のソースとの類似性があったとしても、各要素に「著作物性」はなくて当然ともいえる。

では、「事実」の配列はどうだろうか? この点は、元記事とAI生成文章に類似性がありそうだ。しかし、「平安時代に「客星」が現れた→「明月記」にもある→いまでは「SN1006」と呼ばれている→まだ膨張している→京都大学が調べている」という流れには独自性はあるか?

記事のキモは「SN1006」につての京都大学の研究である。それを語るのに「客星」「明月記」を最初にもってくるのは、ネット上の類似記事をみてもわかるとおり、「定石」ともいえる。

さらに、論述の流れは、いわば「アイデア」であって、著作権では保護されない。保護対象は、あくまで「表現」されたものだからだ。

こういうことを根拠に、新聞界が著作権法改正を訴えて、日本のAI開発全体を押しとどめようとするのは、たいへん筋悪だと考える。AIがもたらしうる「文化の発展」を阻害する。

新聞界は、著作権法改正ではなく、不正競争防止法など、ほかの切り口から主張の正当性を訴えるほうがよいのではないか?

新聞社は過去記事のアーカイブで稼ぐことよりも、最新の問題を誰にも忖度なく迅速に伝えることで、読者を獲得することにもっと注力するべきではないのだろうか。保護を求めて権力にすり寄っていては、「ペンの力」が鈍ろう。新聞が伝えたことが時事の、そしてやがては歴史の事実として、人間の脳のなかにも、AIのニューラルネットのなかにも蓄えられ、そこから新たな言葉が紡がれる。そういうところに、新聞の存在意義があると思うのだけど。

2023.10.23追記:

実際に委員会を傍聴した鷹野凌氏のブログによると、新聞協会の意見陳述は委員からケチョンケチョンにいわれたみたいです。ただし、これはAIが47条の5の軽微利用にあたることをしているのかではなく、元記事を学習しなくてもそれ以前の公開記事からAIが生成可能ではないかということではないかと考えます。さらにいえば、讀賣の元記事だって(「引用」ではなく)ネット検索で知った「事実」をもとに構成している可能性があります。もちろん、それは全然OKだとわたしは考えます。