『WIRED』記事の一部をPerplexityは“盗用”したか? 法律の専門家らが見解

Perplexityのチャットボットに、『Forbes』記事の盗用疑惑について調べた『WIRED』記事について説明させたところ、今度は『WIRED』記事の盗用が疑われるような出力をした。この行為が著作権侵害や名誉毀損などの法的請求に晒される可能性があるかどうかについて、専門家の意見は一致していない。
Illustration of two figures pointing at each other both filled with screenshots of the Wired story about Perplexity...
Photo-illustration: Jacqui VanLiew; Getty Images

『WIRED』は今月、AI検索スタートアップの「Perplexity」についての記事で、『Forbes』が記事盗用を非難していることを取り上げた。この記事を共同執筆した同僚のドルーヴ・メフロータとわたしは独自調査をした結果、開発者からアクセス拒否されているはずのウェブサイトの一部を、Perplexityがクローラーでスクレイピングしてダウンロードしていることがわかったと報じた。この事実は、Perplexityが出している「ロボット排除プロトコル(Robots Exclusion Protocol)」を尊重するという方針に反している。

わたしたちの調査では、ほぼ確実にPerplexityのものだと思われるIPアドレスが、プロンプトの求めに応じて『WIRED』のテストサイトをスクレイピングし、その結果をPerplexityのチャットボットに渡しているように見えることがわかった。そのIPアドレスは、ソフトウェア開発者のロブ・ナイトが別の調査で突き止めたのと同じもので、Perplexityが公開していたIPの範囲には含まれていなかった。 サーバーログによると、そのIPアドレスは過去3カ月間にコンデナスト(『WIRED』の親会社)が所有するサイトに少なくとも822回アクセスしていた。サーバログの記録は一部しか残っていないため、これは実際よりも少ない数値である可能性が高い。

また、わたしたちはチャットボットが技術的な意味でも「でたらめ」を出力していることも報告した。ある実験で、Perplexityのエージェントがアクセスしていないと思われるウェブサイトについて、その内容を要約するように指示したところ、チャットボットはそのサイトとはまったく関連しない意味不明な“キノコの道をたどる少女についての物語”を生成した。 PerplexityとCEOのアラヴィンド・スリニヴァスは、この『WIRED』の報道について、実質的には異議を唱えなかった。「『WIRED』からの問いかけには、Perplexityとインターネットの仕組みに関する深刻な誤解があります」とスリニヴァスは声明で伝えた。ジェフ・ベゾスのファミリーファンドやNVIDIAなどから支援を受けているPerplexityは、最近の資金調達ラウンドで10億ドルの価値があるとされている。『The Information』は先月、同社が次のラウンドで30億ドルの評価を目指していると報じた(ベゾスは取材メールに返答せず、NVIDIAはコメントを控えた)。

『WIRED』記事の盗用疑惑も浮上

記事を公開した後、わたしは主要な3つのチャットボットに指示して、『WIRED』によるPerplexityの盗用疑惑についての記事のことを説明させた。OpenAIのChatGPTAnthropicのClaudeは、記事の主題について仮説を生成したものの、記事そのものにはアクセスできないと説明した。一方で、Perplexityのチャットボット、は、記事の結論とそこに至った証拠について、かなり正確に要約を行ない、6段落・287語のテキストを生成した。(『WIRED』のサーバーログによると、前述したIPアドレスのボットが、記事の公開日にアクセスを試み、404エラーが返された記録がある。ただ、すべてのトラフィックログが残っているわけではなく、これがPerplexityの情報収集活動全体を示しているかどうかはわからない)。

生成されたテキストの冒頭にはオリジナルの記事がリンクされており、最後の5つの段落のそれぞれの後に小さな灰色の円がオリジナルへのリンクを表示する。5段落目の最後の3分の1は、オリジナルの記事にあった一文、「アメリアという名前の少女が『ウィスパー・ウッズ』という魔法の森で光るキノコの道を進むという物語を生成したのである。」を正確に再現していた。

わたしと同僚たちは、これを盗用(plagiarism)だと感じた。ジャーナリズム研究機関のPoynter Instituteが公開している記事盗用のテスト基準を満たしているように思えたのだ。特に「7から10語のテスト」という、「ほかの著者の作品に含まれる7つの連続した単語を偶然に複製する��とは難しい」というものが注目された(このテストが盗用であるかどうかの識別に役立つとしていたPoynter Instituteのシニア・バイズプレジデントであるケリー・マクブライドは、取材メールに返答しなかった)。

「もしわたしの学生がこのようなストーリーを提出したら、学術不正行為委員会に盗用の罪で告発すると思います」。テキサス大学オースティン校のジャーナリズムスクールで教授を務めるジョン・シュワルツは、元の記事と要約を読んだ後にこう語った。「これはあまりにも近すぎます。Perplexityのバージョンを読んでいるとき、まったく同じ文章ではないかと思いました」

こうした専門家による批判について、PerplexityとそのCEOであるスリニヴァスにコメントを求めたが、返事はなかった。

コロンビア大学ジャーナリズムスクールの教授であるビル・グルエスキンは、要約を見たところ、チャットボットの出力だとわかってるなら「大丈夫な範囲なのではないか」とメールに記したが、『WIRED』の元記事を読む時間がなかったこともあり、判断が難しいと記している。「引用符なしで文をそのまま引用するのは、もちろんよくありません」と彼は書いている。「もし報道機関がこのようなAI要約を出典を明記せずに公開しているとしたら、それはかなり恥ずかしいことでしょう。人間がつくったというフリをしていたなら、なお悪いです」(Perplexityはもちろん、出力された内容を人間がつくったものだとは主張していない)。

要約は著作権で保護されないが……

おそらくPerplexityとその支援者にとって幸運なのは、これが文字通り学術的な議論であることだ。盗用(plagiarism)は職業倫理に関する概念であり、ジャーナリズムや学術のように情報源の特定が決定的な意味をもつ文脈では致命的だが、法的観点ではそれ自体としてはそこまで重要でない。もし競合するスタジオがアニメーション映画の『インサイド・ヘッド2』のかなりの部分を含む映画を公開したとしたなら、ディズニーは盗用ではなく著作権侵害(copyright infringement)で訴えるだろう。同様に、『Forbes』がPerplexityに法的措置を警告する手紙を送ったと報じられているが、これは『Forbes』の著作権を「故意に侵害」したと言及しているという。ここで法律の専門家は、おそらくPerplexityがやや安全な立場にあるだろうという意見をくれた。

「著作権に関しては、これは難しい判断です」とコーネル大学の法学教授をであるジェームズ・グリメルマンは言う。要約は事実を報告していて、これは著作権で保護されないものだ。その一方で、元の記事を部分的に複製し、そこにある詳細を要約している。「著作権の事案としてど真ん中のものではないですが、かといってささいでも、くだらないものでもありません」

グリメルマンは、Perplexityに対して消費者保護、不公正広告、または詐欺的取引行為だといった主張がなされる可能性があると考えている。Perplexityがロボット排除プロトコルを尊重していると言いながら、実際にはそうしていないという観点があるからだ(プロトコルは、自主的なものだが広く遵守されている)。

彼はまた、情報の価値が短期間しか存続しないニュースを不正利用したという主張に対してもPerplexityが脆弱であると考えている。これは出版社が、自社コンテンツから商業的に利益を得る前の段階で競合他社が要約したり、有料購読者にとっての価値を損ったりしたために、著作権を侵害されたという主張だ。Perplexityにみられるペイウォールを回避する能力は「彼らにとってよくない事実」であり、そのシステムが自動化されていることも同様に不利に働くだろうという。

グリメルマンはまた、Perplexityが通信品位法の230条の保護を失っている可能性があるとも指摘している。この法律は、Google検索のような検索エンジンをほかのコンテンツプロバイダーから情報を伝えるサービスとして位置づけ、名誉毀損の責任を負わないで済むように保護している。彼の見解では、Perplexityも正確に要約する限りは同様に保護される(AIが生成した内容が230条の保護を受けるかどうかについては議論されている)。

「彼らがトラブルに巻き込まれるのは、ストーリーを誤って要約し、もともと名誉毀損的でなかったものを名誉毀損的にしてしまった場合だけです。特に元の情報源を明確にクレジットしていない場合や、読者がその情報源に簡単にアクセスできない場合、これは法的リスクを伴うものになります」と彼は話している。「Perplexityの編集がストーリーを名誉毀損的にしてしまった場合には230条の保護は適用されません。いくつもの判例の解釈に基づくなら、そうなります」

『WIRED』が確認した一例では、Perplexityのチャットボットは『WIRED』の記事を誤って要約し、カリフォルニア州の特定の警官が罪を犯したと出力した。ただ同時に、元記事へのリンクも目立つ形で表示していた(スリニヴァスは、Perplexityに関する『WIRED』の記事を受け、次のように語っている。「回答が100%正確ではなく、ハルシネーション(幻覚)が起きる可能性があることを率直に伝えてきました」「とはいえ、正確性とユーザー体験の継続的な改善が、わたしたちのミッションの中核にあります」)

「もし、この一件が法廷で争われたとすれば」と、グリメルマンは語る。「一連の訴えは訴えを却下しろというさまざまな反論を潜り抜けられる可能性があると思います。最終的に勝つかどうかは別として、『Forbes』と『WIRED』そして警官という十分な数の原告が、主張を証明でき、ほかの事実がPerplexityにとって悪いものであれば、法的責任を負うことになる可能性もあるでしょう」

必要なのはまったく新しい法的枠組み

すべての専門家がグリメルマンに同意しているわけではない。カリフォルニア大学バークレー校の法学教授であるパメラ・サミュエルソンはメール取材に、次のように答えた。著作権侵害は「著作者が適切な報酬を得る権利を損なうかたちで、許可を得ずに他者の表現を使用した場合に問題となります。ひとつのセンテンスをそのまま使用しただけでは、著作権侵害とまではいえないかもしれません」

ニューイングランド・ローのフェローであるビャマティ・ヴィシュワナタンは、今回の要約そのものに、一般的な著作権裁判で侵害が認められるほどの類似性があるとまではいえないだろうと話す。しかし、問題がないとは思わないという。「スニフテスト(嗅ぎ分けテスト)には合格しないでしょうね」と彼女はメールに返答している。「実際にコピーされた表現が数多くあるなら、訴えが認められる可能性も十分にあるのではないでしょうか」

とはいえ、ヴィシュワナタンはこのような狭い範囲の技術的な部分に焦点を当てることは、正しい考え方でないかもしれないとも指摘している。テック企業が、時代遅れの著作権法の条文を順守しながらも、法の目的を大きく逸脱してしまう可能性もあるからだ。市場の歪みを是正し、米国の知的財産法が目指す価値を守るためには、まったく新しい法的枠組みが必要だとヴィシュワナタンは考えている。法の基本的な目的のなかには、ジャーナリズムのようなクリエイティブな仕事に従事する人が経済的利益を得られるようにし、また、それらを生み出す動機を与えることが含まれている。これは理論的には、社会に利益をもたらすものだ。

「生成AIが、大規模な著作権侵害の上に成り立っているという直感を支える強力な論拠はある、というのがわたしの意見です」と彼女は書いている。「まず最初にするべき質問は『ここからどこに行くのか』ということです。そして長期的には、クリエイターとクリエイティブ・エコノミーが生き残るためにどうするのかという、大きな問題があります。皮肉なことに、AIは創造性には価値があり、かつてないほど需要があるということを教えてくれています。しかし、このことに気づく一方で、(生成AIには)クリエイターが生計を立てるためのエコシステムを損なう、そして最終的には破壊するポテンシャルがあることが見えています。これは、もっと先ではなく、いま解決する必要がある難問なのです」

(Originally published on wired.com, translated by Mamiko Nakano)

※『WIRED』による生成AIの関連記事はこちら


Related Articles
Photo of copies coming out of a machine within the shape of a brain, surrounded by glitchy Wired headlines
『Forbes』は自社のコンテンツを盗用されたとして、AI検索スタートアップのPerplexityを非難した。『WIRED』が調べたところ、Perplexityのチャットボットは許可を得ていないサイトを無断でスクレイピングし、“幻覚”を見せる傾向があることが明らかになった。
Shadow of a person operating a smartphone
一部のアプリでは、あなたのコンテンツが生成AIの学習に使われないように設定することができる。ChatGPTやグーグルのGeminiなどから(少なくとも多少は)主導権を取り戻す方法を紹介しよう。

雑誌『WIRED』日本版 VOL.53
「Spatial × Computing」6月25日発売!

実空間とデジタル情報をシームレスに統合することで、情報をインタラクティブに制御できる「体験空間」を生み出す技術。または、あらゆるクリエイティビティに2次元(2D)から3次元(3D)へのパラダイムシフトを要請するトリガー。あるいは、ヒトと空間の間に“コンピューター”が介在することによって拡がる、すべての可能性──。それが『WIRED』日本版が考える「空間コンピューティング」の“フレーム”。情報や体験が「スクリーン(2D)」から「空間(3D)」へと拡がることで(つまり「新しいメディアの発生」によって)、個人や社会は、今後、いかなる変容と向き合うことになるのか。その可能性を、総力を挙げて探る! 詳細はこちら