慶應義塾

【特集:AIと知的財産権】座談会:生成AIと共生するために考えておくべきこと

登場者プロフィール

  • 852話(はこにわ)

    AIアートディレクター

    2010年頃からイラストレーター、映像作家としてクリエイター職に就く。ゲームディベロッパーとしての実績もあり、22年夏からAI技術に傾倒。

    852話(はこにわ)

    AIアートディレクター

    2010年頃からイラストレーター、映像作家としてクリエイター職に就く。ゲームディベロッパーとしての実績もあり、22年夏からAI技術に傾倒。

  • 杉浦 孔明(すぎうら こうめい)

    理工学部 情報工学科教授

    2007年京都大学大学院情報学研究科博士後期課程修了。博士(情報学)。情報通信研究機構主任研究員等を経て、20年慶應義塾大学理工学部准教授。22年より現職。専門は知能ロボティクス、深層学習等。

    杉浦 孔明(すぎうら こうめい)

    理工学部 情報工学科教授

    2007年京都大学大学院情報学研究科博士後期課程修了。博士(情報学)。情報通信研究機構主任研究員等を経て、20年慶應義塾大学理工学部准教授。22年より現職。専門は知能ロボティクス、深層学習等。

  • 矢向 高弘(やこう たかひろ)

    システムデザイン・マネジメント研究科 教授

    塾員(1989工、94理工博)。博士(工学)。慶應義塾大学理工学部准教授等を経て23年より現職。専門は符号理論、コンピュータネットワーク等。慶應義塾大学AI・高度プログラミングコンソーシアム代表。

    矢向 高弘(やこう たかひろ)

    システムデザイン・マネジメント研究科 教授

    塾員(1989工、94理工博)。博士(工学)。慶應義塾大学理工学部准教授等を経て23年より現職。専門は符号理論、コンピュータネットワーク等。慶應義塾大学AI・高度プログラミングコンソーシアム代表。

  • 奥邨 弘司(おくむら こうじ)

    法学研究科 教授

    1991年京都大学法学部卒業。98年ハーバード大学ロースクールLL.M. 修了。専門は著作権法、企業内法務。電機メーカー法務本部、神奈川大学経営学部准教授等を経て2013年より現職。

    奥邨 弘司(おくむら こうじ)

    法学研究科 教授

    1991年京都大学法学部卒業。98年ハーバード大学ロースクールLL.M. 修了。専門は著作権法、企業内法務。電機メーカー法務本部、神奈川大学経営学部准教授等を経て2013年より現職。

  • 君嶋 祐子(司会)(きみじま ゆうこ)

    法学部 教授KGRI 所長

    塾員(1989法、96法博)。博士(法学)。1992年より弁護士、法学部助手等を経て2012年より教授。05年ジョージ・ワシントン大学ロースクールLL.M. 修了。専門は、知的財産法、イノベーションと法。

    君嶋 祐子(司会)(きみじま ゆうこ)

    法学部 教授KGRI 所長

    塾員(1989法、96法博)。博士(法学)。1992年より弁護士、法学部助手等を経て2012年より教授。05年ジョージ・ワシントン大学ロースクールLL.M. 修了。専門は、知的財産法、イノベーションと法。

2023/06/05

(出席者)

「ChatGPT」の仕組み

君嶋

本日は、現在、非常に早いスピードで普及している生成AIと知的財産権にかかわることを中心に、皆さまとお話ししていきたいと思います。

今、「ChatGPT」について、テレビをつけても、ネットを開いても、毎日のように議論が行われています。これまでの言語処理に比べると非常に自然な文章が出てくるということで、ものすごいスピードで世界的に普及しています。

これは便利だというポジティブな評価の一方で、AIを教育の場でどの程度使うべきかなどについては論争中で、子どもの成長のためには12歳まで触れさせないほうがいいという意見もあり、議論が巻き起こっています。

一気にAIの技術が身近なものになってきましたが、研究者としてこの技術の開発にずっと取り組んでこられた杉浦さん、ご自身のこれまでの研究と、現在のAIができる技術について、ま ずご紹介いただければと思います。

杉浦

私の専門は知能ロボティクス、機械知能、深層学習です。私は3年前まで国立研究所で音声翻訳も研究していました。音声翻訳はかなり昔から研究されているAIの分野ですが、今は音声翻訳ソフトがスマホに入っていることを知らない人がいないぐらい、一般的なものになっているかと思います。

人間を凌駕するAIもたくさん出てきています。クイズを解くもの、ゲームなどは、人間のチャンピオンを超えています。また、平均的な人と同等以上ということであれば、機械翻訳、音声翻訳は30言語以上できますので、普通の人より優れていると思います。

画像の認識技術も、精度は向上してエラーはどんどん減っており、2015年あたりに人間の認識よりも精度が高いものが得られています。さらにノーベル賞を取れるAIを作るというチャレンジングな研究もあります。

このような人間を凌駕するAIが出てくることは人間にとってどのようなプラスの側面があるかというと、1つには、囲碁の棋士などがAIを使って練習を繰り返し、強くなります。2017年に「AlphaGo」が囲碁のチャンピオンを破ったのですが、それ以降、棋士のスコアが急激に上がっているという研究結果が今年報告されています。AIを練習に使うことで人間のスキルが上がることは様々な分野で見られます。

大規模言語モデルについて少しご紹介します。話題のChatGPT は2022年11月に発表された対話的に文章生成を行う大規模言語モデルです。今年の3月にはGPT-4が出て、これは米国統一司法試験において、上位10%と同等のスコアが取れるレベルになっています。

仕組みは「言語モデル」と呼ばれるものなのですが、やっていることは簡単で、次に来る単語を予測するだけです。例えば「むかしむかしあるところに」の次に、「おじいさんがいました」というのはありそうですが、「おとうさんがいました」は違和感がある。つまり実際の文章の中で発生する確率が違います。大量のテキストデータを読み込み、頻度を学習し、次に出てくる単語を精度よく予測する。これが言語モデルのやっていることです。

この言語モデルからChatGPTのようなプログラムが生まれるというのが、われわれ研究者にとっても非常に驚くべきところです。

また、ChatGPTは、お使いいただくと、毎回同じ文章が出てくるわけではないことがわかると思いますが、ランダムな要素を少し入れることで全く違う文章を出すことができます。このような枠組みで言語モデルはできています。

画像生成AIの進化

君嶋

よくわかりました。次にAIアートディレクターとして画像の創作をされ、AIの技術をまさに実用化されている852話さん、創作の中で直面していることなどをお話しいただけますか。

852話

画像生成AIというモデルで言えば、去年の7月にMidjourneyというサービスが出て、とても話題になりました。

このサービスは、「テキスト・トゥー・イメージ」という形態を利用しています、つまり、文字を入力すると、それが画像になって出力されるモデルです。例えば「花・女の子」と入れたら、花と女の子の画像が出力される。元のモデルとして億単位の大量の画像を学習させ、ベクトルの形にして特徴を覚えさせたものがデータの塊としてあり、その中からテキストで入力した情報と近似した特徴を拾い上げ、画像生成して出力する、と考えればイメージしやすいと思います。

Midjourney が出てきた時、それまでの画像生成AIのシステムとは比べ物にならないクオリティーで、クリエイティブな画像が生成されたので大変な話題になりました。「え、これ、人間がつくったんじゃないの?」というクオリティーの画像がどんどん出力されるようになったわけです。

それで、もしかして今までクリエイターの人たちがつくった商業的な画像を、つぎはぎしてコラージュしているのではないかというイメージが一般に広がり、問題になったのですね。

基本的にはAIのモデルのデータの塊の中には画像そのものは入っていません。ここに線があったら人間は気持ちよく感じるといった概念的特徴や、杉浦さんが文章生成で説明されたように、ここに線があったら、次にこの色がくるといった「お約束」をモデルが覚えるのです。基本的に、言語モデルの仕組みとそれほど変わらないのです。

でも、画というのは、ピクセルの塊なので、並ぶとわからないので、結果、既成の作品を切り貼りしたのではないかというぐらい、精度の高いAIによる画ができてしまう。アートには、これまで人間によるオリジナリティーや技術、創作活動が強くかかわっていたと思っていたのに、機械がそれを何のことはなく瞬時にやってしまう。

なので、これはもしかして人間が創った画像がコピーされていたり、つぎはぎしているのではないかという疑念が生まれて問題になったりしています。もともと、何で勝手に私の画が学習されているのかといった心情的な問題もあり、クリエイターの方々は複雑な感情を抱えているのです。

君嶋

AIを使って創作している方はどのようにやっているのでしょう?

852話

「プロンプト」という文章で指定をして、ランダムに何百何千と出した画像の中から1枚を選び取る方と、頭の中にある想像した画像を思い通りに出力するために、棒人間(手足を棒のように表現したキャラクター)でポーズをとらせ、それにAIの画像を合わせていく手法を取っている方の2種類がいます。

この2つは創作活動としては別物だと思うのですが、出力される画像は見分けがつきません。どこに創作的活動の部分があるのかは、すごく難しいところだと思います。私はどちらの手法も取りつつ画像を生成しています。

君嶋

852話さんの画集を拝見しましたが、非常に素敵なイラストで、一部は、こういうプロンプトを入れたと紹介された上で画を出されている。「この言葉を入れるとこういう画が出てくるのか」と思い、感心しました。

クリエイターの方は創作活動の中でどういう形でご自分の表現を加えていくのでしょうか。

852話

頭の中にあるイメージをAIに指示する際、画像を指示データとして与える「イメージ・トゥー・イメージ」というやり方もあるのです。つまり、似たような画像を出して指示を与えることができます。それは完成した画でもいいですが、棒人間で、こんなポーズを取ってほしいという指示画像でもいいわけです。

これは、テキスト・トゥー・イメージで、漠然と「太陽があって、ヒマワリがあって、麦わら帽子の女の子がいるのをつくって」と言う指示と、全然違うわけです。

ただこのイメージ・トゥー・イメージには問題があって、画像データであれば何でも指示できてしまうので、例えば他人の著作物でも指示画像として利用できてしまう。そして数値を操作することによってそれとかけ離れた画を出すこともできるし、ほとんどオリジナルと変わらないような画像を出すこともできるわけです。

君嶋

ネット上で、自分のイラストが変えられたAI画像が出ていたなどと炎上して大騒ぎになる事例は、イメージ・トゥー・イメージで作成されているのでしょうか。

852話

大体はその問題だと思われます。

AIに入れるデータの利用

君嶋

もともとの教師データとかアルゴリズムがあり、そこに指示をする際に画像イメージで指示を入れる場合と、言語で指示を入れて画像を作成させる方法があるのだとわかりました。その中で知的財産権に関して、問題視されることが実際に起き、アメリカでは実際に訴訟も起きています。

日本では、AIに入れるデータの利用に関して著作権法はどのようになっているのか。奥邨さん、ご説明いただけますか。

奥邨

日本ではもともとテキストマイニング、データマイニングのための権利制限規定がありました。辞書を作る際とか、写真の顔認識技術を開発したりする際などの情報解析のためであれば、必要な範囲で他人の著作物をコンピューターで無断で利用できるという規定です。

この規定そのままで、AIの深層学習に適用できるかについてはいろいろ議論があったのですが、平成30年(著作権法平成30年改正)に、機械学習全般を含む情報解析に際して、必要な範囲で他人の著作物を自由に利用できるという規定が整備されました。

そのため、日本では現在、AIに機械学習をさせるためであれば、ネット上のものも書籍も、入力=複製することについては著作権法上問題がないという状態になっています。そういう点から、日本は「機械学習パラダイス」とも言われ、世界で一番、明確かつ広く、機械学習に関して著作物の自由な利用を認めていると言われます。

ただ、以上は学習過程の話でして、生成過程を経て、今、852話さんがおっしゃったように、既存の作品とよく似たものがAIから出力されるケースについては、別の議論となります。

君嶋

OpenAIのCEO、サム・アルトマンさんが来日され、日本にオフィスをつくりたいと宣言された理由の1つは、日本の著作権法が、機械学習について制限規定をきっちり設けているのでやりやすいからと言われています。つまり、訴訟リスクを減らせるという企業のメリットがあるのかと思います。平成30年改正がこういった事態を予測して立法されたとすれば、素晴らしいことです。

しかし、そうは言っても、データとして入れ込むなら何でもいいということではなく、著作権の制限の範囲内として許されるということです。著作権には複製権や公衆送信権等、様々な権利が含まれていますが、この制限規定はあらゆる著作権の行使に関して、原則として権利侵害にならない場合を制限列挙しています。同時に、著作権者の利益を不当に害するものであっては駄目だという例外も規定しています。

つまり、データを入れ込んだ結果として著作権者の利益が不当に害されたと法的に判断されると、その結論がひっくり返る可能性が残されています。そこをどう考えるかが、著作権法の解釈としては重要になってきます。

著作権の有無の判断はどうされるのか

杉浦

アメリカでの例を1つあげると、去年の10月にGitHubのCopilotのフリーバージョンで起きた問題で有名なものがあります。

テキサスA&Mユニバーシティの教授が、自分が著作権を有するプログラムのコードがAIで生成されてしまうことを発見した。私は人間が書いたコード、AIのコードの両方を見ましたが完全に同じではないです。でも、コメントというプログラムの本体ではなく自分の考えを出すところが同じで、普通にこれを見たらかなり類似している。ですからこの教授の意見は確かにそうかなと思っています。

プログラムも自分の頭の中にあるものを随時出していくやり方で使われることも多いので、いきなり全部が生成されることはなく、1つずつプロンプトで命令していきます。なので大規模な、例えばあるゲームをつくる場合は、その人間の意図がはっきりしていないとコードはつくれないのが現状です。

どこからが著作物に当たるのかを、ぜひお聞きしたいと思います。完全に一致していないけれど、似たようなものとプログラマーが考えるものが生成されてしまった場合、どうなのか。

また、仕様書と呼ばれる部分に近いのですが、人間の考えをインプットでプロンプトで使った場合は、これはどこまでが著作物になるのでしょうか。

君嶋

いわゆるプロンプトや命令として書かれた言語の著作物性ということですね。奥邨さん、いかがでしょうか。

奥邨

プロンプトそのものを、著作権法上どう捉えるかはまだ裁判もないので、私見になりますが、AI=コンピューターに対する指令ですから、プログラムの著作物と位置付けることが可能だと思います。

非常に簡単なプロンプトだと創作性がないため著作物にはならないと思いますが、複雑なかなりの程度長いプロンプトは、プログラムの著作物と評価できると思います。

しかし、プロンプトと、出来上がった画像が1対1対応しているのであればまだしも、いろいろなバリエーションがあるとなると、プロンプトが直接、出力画像や文章を表しているということではない。そうなると、プロンプトの著作権を持っているからといって出力に対して著作権を持つとは言えなくなります。

杉浦

なるほど。厄介なのがランダム性を入れることが簡単にできてしまうところです。そうすると出力されたものの見た目が結構変わってしまう。最後はやはり個別のケースで判断となると、人間が出力されたものを見て、これは著作権法上問題である、と判定していく形になるでしょうか。

奥邨

そうですね。アメリカでMidjourneyを使って作成した漫画を著作権局に登録しようとした事例があります。これは「暁のザーリャ」(Zarya of the Dawn)事件と言いますが、作者が、特に説明なく申請して、最初はそのまま登録が認められたのですが、登録後に作者がSNSなどで、「Midjourneyを使ってつくった漫画が登録された」みたいにつぶやいたところ、著作権局が作成の状況を改めて調べて、先の登録は取り消されました。

その上で、漫画のセリフの部分は作者が自分でつくったので著作権登録を認める。しかし、Midjourneyから出力された個々の画像については、登録を認めないと決定したのです。

なぜかというと、このケースではかなりアバウトなプロンプトを入力して何百枚も出力した中でイメージに近いものを選び出すようなやり方だったと著作権局は言っています。この場合、作品をつくる上での人間の貢献の程度は低く、この程度では人間が(AIを道具として用いて)著作物をつくったとは言えない、AIが自律的に作成行為を行っていると判断したわけです。そして、アメリカの著作権法は、人間以外がつくったものには著作権を与えないので、この場合も画像は著作権登録されなかったのです。

なお、作者は、AIが出力した画像に、自分で直接描き加えたりもしたとも主張したのですが、ちょっと色を塗ったとかのレベルでしたので、著作権局は、それでは不十分だと判断しました。

プロンプトが一定の影響を与えても、出力に関してランダムに委ねる部分が大きい場合、人間がつくったとは言えない、AIが自律的につくった、そういう考え方が示された訳です。アメリカのケースですが、日本でも大いに参考になると思います。

君嶋

著作権法は、基本的に人間が創作活動をすることを対象にしています。日本の著作権法では、創作性のある著作物を創作した者に、著作者の権利が発生します。各国で制度は違いますが基本的な発想は同じです。AIを道具として使用し、創作活動をした場合、どこにどの程度人間が創作的な寄与をしたかで、それが著作物として著作者の権利の対象になるかが判断されるわけですね。

従来のプログラムの著作物の著作権侵害があるかどうかが争われた事例でも、プログラムが、コンピューターに対する指令として誰が書いても同じになるような単純な指令の組み合わせでしかない場合、あるいは複数の選択肢の中から1つの表現を選択したとは言えない場合は、プログラムとしては機能していても著作物としては保護されない、となります。

また、人が創作性を加えた表現の部分を模倣していると侵害になるけれど、そうでないところが似ているだけだと著作権侵害にならないというのが従来の基本的な考え方でした。これがプロンプトになった場合は、それがそのまま適用されるのか。プロンプトだと抽象度が高くなっているので、そもそも創作的な表現と言えるのかということから争われるケースが多い気がします。

その先に、いろいろな指令に基づいて生成画像ができ、著作物に見えるものが作成された場合、それが著作権法上、保護されるのか。奥邨さんが言われたように、人がどのように創作的に関与しているかを見た上で個別に判断するのか、総合的に判断するのか。基本的には人の創作的な寄与が表現に反映されているかどうかを基準に、生成物が著作者の権利の対象になるかどうかを判断します。

杉浦

そうすると、例えばプログラムをわれわれは書くのですが、後で訴えられないためにプロンプトを保存しておくことも重要ということですか。

君嶋

そうなるかもしれません。

「AI生成物の著作物性」とは

852話

先ほどの「暁のザーリャ」事件のように日本とアメリカは著作権の根本が違います。著作権が認められた作品が著作権を得るというのがアメリカの著作権の考え方です。一方、日本は、つくった時点でその人に著作権があるということになると思います。

現状、AIが出力した、そのままの「ポン出し」を著作権があると認めるのはなかなか難しいとは思います。その著作権のないAIの画像に対して、例えばどのくらい画面に対して変化を与えたら著作権が発生するのか。先ほどちょっと色を塗っただけだと創作活動として認められないと言われましたが、これは今、クリエイター皆が一番気になっていることだと思います。

ただ、それは割合では判断しづらく、結局人間が、これはOK、これは駄目という感じでジャッジするしかないのかと思いますが、それを判断する法的な立場の人も判断はすごく難しいのではないかと思うのですが。

君嶋

AIが関与しない表現物に関しても、著作権法上保護される著作物と言えるかどうかの判断は、ありふれた表現で一定の作成者の個性が表れているかどうか微妙なケースでは、これまでも争われています。AIが道具として入った場合も同じことが言えます。

著作権法では、著作物とは「思想又は感情を創作的に表現したもの」になります。そのような表現行為は人が行うものというのが従来の考え方なので、その解釈はわれわれ社会の人たちが行い、法律上、著作物と言えるかどうかの判断をするわけです。最終的に紛争になった場合は裁判官がそれを判断し判決をする。紛争の当事者間ではその判決が強制力を持つ。これが現状です。

奥邨

「AI生成物の著作物性」と言った時に、「あるか、ないか」の議論になりますが、正確ではありません。AIが全く新規につくったものについては、「あるか、ないか」でよいですが、既存のものを一部取り込んでいるような場合には既存の部分は他人のものとして、著作物性は「ある」のです。

AIがつくったら既存のものが入っていても著作物性がなくなってしまうわけではない。新しくつくった部分と、既存の部分の組み合わせの場合、分けて考える必要があります。この点は、AIの登場による新しい問題ではなく、人間が既存のものを組み合わせたときと同じです。

852話さんがおっしゃった「ポン出し」でも、全く今まで存在しないものをAIが自律的につくったのであれば、全く著作権がないです。これに852話さんが手を加えた時に、個性が表れている部分があれば、その部分にだけ852話さんの著作権があることになります。

もしAIから出たポン出しのものが他人の既存のもののコラージュ的なものだと、既存の部分は、当然その作者に著作権があることになる。そこに手を加えたら、侵害物に手を加えてしまったことになる。

また、「何パーセントか」ということはなかなか難しく、従来から言われているように作者の個性が表れているかどうかで説明していくことになります。

スタイルと表現をめぐって

852話

オマージュ、コラージュ、リスペクトというのは、今までの対人間の作品群でもあったと思います。単純に画像を用いて画像を生成する。だから他人の著作物を用いてAI生成物を出した時に、既存の著作権が残るのは理解できます。

ただ、基本的に今モデルとして画像を学習させるという一番初期の段階は法律上、別に問題ないわけですが、それを用いて出した画像は著作権が元に戻っているという話なのですか。

モデル自体は画像そのもののデータは入ってなくて、概念的なデータとかベクトルとしての、数字としてのデータが入っているという話で、ピクセルとか画の線そのものが入っているわけではない時、その著作権はどこに入っているのかが非常に気になります。

奥邨

例えばある図形の表現をベクトル・データ化しても複製は複製です。データの持ち方としてピクセルなのか、ベクトルなのかは、同じものが再製されるのなら差はありません。データを、アナログで持つのとデジタルで持つのと、どちらでも一緒だというのと同じ話になります。

問題は、表現をどこまで抽象化して人工知能が理解をしたのかということです。

852話

再現性がどれぐらいあるかという話になりますか。

奥邨

再現性は結果的な問題となります。どうやって、出力ができあがったかの過程・仕組みの話がポイントです。AIは、画のスタイル・画風のところまで抽象化されたものを持っていて、それに基づいて描いたので、似た絵になったと説明ができるかどうかです。

これは技術と法律の両面からの評価の問題になります。技術的には元の画そのものは持っていないといっても、その法的評価として、結果的に元の画が何らかの形で残っているとされることもあり得ると思います。

例えば、「ピカチュウ」と言葉で指示して、ピカチュウとそっくりな画が出てくる場合、そのAIが画像としての「ピカチュウ」を持っておらず、あくまでもピカチュウの概念を抽象的に理解し、同じものがたまたま出てきたのだ、と証明することは難しいと思います。ピカチュウという言葉だけからあの具体的な画は出てこない。あの画そのものを人工知能が覚えていると評価されがちだと思う。

ところが「ポケモン」というものをいくつも学習させて、実際には存在しない「カーネーションポケモン」をつくれと指示したら、画が出てきた。それが、後に公式につくった「カーネーションポケモン」に似ているという場合は、ポケモンに共通するスタイルを身に付けただけであって、それに基づいて描いたら偶々似ていた、ということになるんだと思います。

人間でも、何々風の絵を描く人はいっぱいいますが、それがOKか、アウトかは、事例毎に考えないといけません。

852話

例えばドラえもんの絵かき歌みたいなのを覚えた、というような概念はどうなんでしょうか。

奥邨

全く同じドラえもんの画が出てくると、概念を覚えたのではなく画を覚えたんでしょうと裁判所に判断されがちだと思います。ただ、概念は一緒だけど学習したのとは全然違うドラえもんの画も出せるのであれば、それは概念を覚えたのだという説明がしやすくなると思います。

君嶋

著作権法上は、スタイルは真似してよろしい、具体的な表現は無断で真似してはいけない、というのが基本的なルールです。

ですので印象派風の描き方、点描で描きますといったスタイルは、誰も独占できません。独占させると人間が自由に表現できなくなるからです。それに対して、印象派のモネが描いた睡蓮の具体的な表現と似た絵を描いた場合には、具体的な表現を真似していることになり、著作権の存続期間中は、(私的複製などの著作権制限事由に当たらない限り)著作権侵害になります。

ですからAIが間に入っても、出力された画像やプログラムが、今の考え方からして具体的な表現を模倣したと判断されるかどうかで、著作権侵害になるかどうかが最終的に決まってきます。

杉浦

有名な深層学習の教科書にまさしくポケモンの画像を学習して実際にいないポケモンを生成する例が載っていますね。

奥邨

被告側に有利か不利かで言うと、既存のポケモンに似ているポケモンが出るだけだと不利で、ポケモン風の新しいものが出せるのなら有利になると思います。

ピュアにスタイルを学習しているAIと、スタイルを学習しているように見えて実は画そのものを保存しているに過ぎない「なんちゃって」スタイル学習AIとに、これから法律上は評価が分かれるのではないか。

アメリカのMidjourneyが今、集団訴訟で訴えられていますが、原告は、AIはスタイルを学習しているのではなくて、学習対象画像を圧縮して持っているのだと主張しています。この訴訟の結論が出ると、セーフかアウトかの方向性が出てくる可能性はあると思っています。

君嶋

2022年10月にShutterstockという写真やイラストの提供サービスが、OpenAIとの提携によりAIの画像生成ツールを提供すると発表しましたが、その際に、元になる画像データの著作者に報酬を払う仕組みをつくるとしました。これはまさに訴訟リスクを避けるための取組みかと思います。

杉浦

Shutterstockの規定には「寄稿者の知的財産がオリジナルモデルの開発で果たした役割に対して報酬が支払われます」と書いてありますね。法的にはどこまでが役割で、どのように分割すれば正しいというのはこれから決まっていくのですか。

君嶋

生成された画像を見て、オリジナルだと主張する画像と比較して、オリジナルの画像の創作的な表現部分を生成画像が利用していると判断された場合、今おっしゃった表現が当たると判断するのではないかと思います。

矢向

訴訟が起きないように規約を先につくってしまったということですよね。おそらく機械学習の最後のほうの層はかなり具体的なデータになっているはずだから、きっとそこには原著作者の権利が含まれている。それを利用されて著作権を侵害していると訴訟を起こされた時に負ける可能性があるから、あらかじめある程度お金を払う仕組みを先につくったのだと思います。

杉浦

例えばこういうのが法的に正しいのだということになると、そういうモデル、役割を算出できるようなAIを開発するインセンティブにもなります。

AIと人間の創作物は違う?

君嶋

従来の判例で著作物を利用しているか、侵害しているかどうかは、これまでは人がある意味直感的に、ここは著作物の創作的表現を使っていると判断してきました。でも画像処理の技術、言語解析の技術がどんどん発達する中、やろうと思えば、何パーセントこの画像の表現を使っているのかという解析が可能になっています。

ただ、それをどこまでやるべきかは非常に大きな問題で、人間の創作活動も、全くゼロから、先人の著作物と何も似ていない表現を創作することはまずない。われわれは子どもの時からいろいろな小説を読み、映画や画像を見て、音楽を聴いて、その蓄積されたデータが、ある意味教師データになり脳と手を使って創作活動をしている。

そうすると、人間がこれまでやってきた創作活動とAIを比べて、AIの時だけ非常に細かく判断しなければいけないのか。便利な道具ができたにもかかわらず、AIを使ったらかえって面倒くさくてお金を払わなければいけないとなると、結局は人間の文化や産業の発展を阻害することになります。

ですからどこまでオリジナルの人たちの権利を保護し、財産的な利益を確保してあげて、どこからは自由に利用して新たな創作活動が人間とAIの協働でされることを奨励していくのか。これは非常に難しい判断になります。

奥邨

AIを用いた「創作」についての議論で注意をしないといけないのは、どのような場合にAIを使って「創作した」とするかの議論は、人間が創作活動をする時にも跳ね返ってくる可能性がある点です。何をしたら創作と言えるのか、その基準は、AIを用いる場合も、人間が伝統的な方法で創作する場合にも当てはまります。

今、AIを用いた創作について一部でかなり厳しい批判的意見を見ますが、実は、その刃は人間が創作する際にも向いているのです。

今まで著作権法は、人間が創作することを前提に結構アバウトな感じで議論してきましたが、AIの登場で、創作とは何か、何がスタイルで、何が表現か、などについてもっと突き詰めて考えないといけなくなりました。人間は、スタイルと表現の区別は実はそんなにできないので、これまでは、表現側に引っ張って理解していた。でもAIは、スタイルと表現の境界線をビシッと引けるかもしれない。

また、類似しているかどうかを判断するAIをつくることはできても、それをどの程度使っていくのか。どこまでそれをやるのか。いろいろ議論していかないといけないことも起き始めているのかなと思います。リジッドにやり過ぎるのもハッピーかどうかわからないですね。

君嶋

著作権は相対的な排他的権利です。つまり、他人の著作物に依拠して似たものをつくった場合には著作権侵害になるけれど、偶然、表現が似てしまってもかまわないというのが著作権法の考え方です。

皆が創作活動を自由にやる中、似たような画、似たような小説はいくらでもあるわけです。それはたまたま似てしまったのだからかまわないということで、これまではある意味、アバウトに判断してきましたが、それがAIが入った時にどうすべきか、ですね。

AIを使った発明の創作性

君嶋

著作権の話題だけでも尽きませんが、私は主に特許法を研究していまして、AIにより発明ができるようになってくると、それを特許法で保護すべきか、同じように議論されています。

現在、AIを使って技術的な発明をする分野は、一番はプログラミングなのだと思います。それ以外にも創薬の分野でAIの使用が進められているかと思います。

著作権法と違い、特許法の場合は、アイデアを保護する。技術的な課題を解決するための具体的な解決手段を思いついた、それはまさにアイデアそのものですが、それを保護するのです。

現在、杉浦さんはAIを使ってプログラムをされるということでしたが、AIはどの程度の創作性を持ち得るのか。特に技術的課題を解決する面でAIは使えるのでしょうか。

杉浦

1月に自分の授業でChatGPTを使って学生にプログラミングをやらせてみました。プログラミングはビギナーにとっては、わからないところを1つひとつ各自のレベルに応じて教わることが重要ですが、そういう意味でChatGPTは画期的な教育方法だと思います。深層学習のプログラムについては簡単な部分であれば実際に生成することは可能で、ステップ・バイ・ステップでわからない部分を聞くことができます。

ただ難しいところもあります。ニューラルネットはパラメータの数でどれぐらい複雑なことができるかが決まるのですが、そのパラメータ数がどれぐらいかと聞いても、結構いい加減な回答をしてきて、これだと専門家的には使えないクオリティーです。

初級知識に関してこちらが検証するという条件下では非常に有用だと考えていますが、一方、高度な知識を生成するには、アイデアの部分をプロンプトで入れない限り難しいのが現状です。

君嶋

弁理士が実際に特許出願の書類を書く時は、従来の技術でどういうものがあったかをまず説明する。そして、その従来技術では解決できなかった課題を今回の発明ではこのように解決したというように、発明を説明していきます。従来の技術は、正確な検索をかければ論文や昔の特許出願のデータが拾えるわけで、その検索をした結果を正確に要約する作業はコンピューターが得意なのだろうと思います。

そこから、これまで解決できなかった課題を解決する手段を新たに思い付くところはまだできないのでしょうか。従来の技術のデータをどんどん学習させていけば、平均的な技術者がすぐには思いつかない課題解決も、データ解析によりできる時代がくるのかと想像するのですが。

杉浦

今、主流のニューラルネットという手法は、内挿・外挿という考え方で説明がつく部分があります。実はニューラルネットは外挿が非常に不得意です。つまり、今までなかった知識を外側につくるのが今の技術だとかなり難しい。

ですから本質的に新しいものをつくるには人間の助けが必要なのです。ただし内挿が得意だということを生かすと、A分野とB分野の中間のところを今まで特許として捉えていなかった場合は、発見できてしまう可能性もある。そういったアイデアはAIでも思いつく可能性があると思います。

矢向

内挿・外挿の話も空間がとても広いと端と端だけが知識としてあり、間がすごく空いているのでいくらでもバリエーションが出てくる。だから内挿だけが得意だからといって必ずしも新しい発想が出ないわけではないと思います。

もう1つ、もっと古い技術ですが、遺伝的アルゴリズムがあって、これは人間があらかじめこれとこれの組み合わせがほしいと、バリエーションを与えた上でどのぐらい配合するかを決める方法があります。そういうものであれば、発見はたぶんいくらでもできて、それでロボットを制御することも昔から多くやられています。

その技術を化学の分野に応用すると新しい創薬などもできるようになる。そこは今、やっておられる方がたくさんいると思う。それを仕込んだ人間が偉いのであり、私は発明として捉えていいのではないかと思っています。

杉浦

そうですね。例えば重要な研究が1つなされると、次の年に周辺研究が多く発生することは、これまでもありました。そういう形で一点だけ人間がつくれば、その近くを全部AIが埋めるということがあり得るかもしれません。

AI前提社会をどう考えるか

君嶋

そうするとAIが内挿の部分をしっかりやってくれる時代になれば、人間はクリエイティブな部分の作業に専念でき、より高度な発明が生まれやすい環境が出てくるのでしょうか。

杉浦

そうですね。例えば最初に囲碁の棋士のレベルの話をしましたが、ツールを使って人間の発明力が上がる形も考えられると思っています。

君嶋

まさにそこを教育者としては期待しています。われわれ文系の論文を書く作業を考えた時、その問題について書かれた従来の論文を読み込んで、これを要約し解析をした上で自分の考察を加え新たな見解を出していくわけですが、そういった作業をAIに手伝ってもらえるようになる。

AIに任せられるようになれば、今、たくさんの量の先人の論文や判例を読みこなすのに四苦八苦しているところを、だいぶ時間を節約できるようになる。結果、そこから何を考えるかという部分に人間の時間や労力を集中できるようになると思います。

矢向

私は教育という立場で考えると、「AIはとにかく使いこなせ」と学生にはいつも教えるようにしています。道具は使えるようになるに越したことはなく、今さら電卓も使わずに全部筆算でやるのは効率が悪い。同様に使えるものはとにかく使う。自分を高めるために使う分には全然問題がなく、むしろ奨励すべきと思っています。

ChatGPTの文章をそのままリポートにするのはナンセンスですが、先ほどの囲碁の話のように、AIとやり取りしながら自分を高めていくことには積極的に使うべきだと思います。

杉浦

私も同意見で、鉛筆や辞書と同様にAIはツールです。ツールであるなら、適切な使い方を教育する、という考え方もできます。

一方、AIが米国の資格試験のいくつかで合格圏のスコアを取れているなら、同様の難易度のリポートのみで人間の成績を判定するのは、難しくなるかもしれません。AIで解ける問題のリポートのみでしか成績を付けないということは社会的に今後許されていくのか。ここは私たちも考えるところだと思います。

奥邨

Googleが生まれてから、論文を書く上では、検索が大前提になっていますよね。ただ、検索にも上手な人と下手な人がいて、論文指導をしていると、発想はユニークなのだけど、検索が下手なのか、集めてしまったものが的外れという人がいるわけです。しかし、これからはAIがサポートしてくれて検索下手はなくなるかもしれません。

ただそうなると、すぐにAIで再現できるレベルは評価されなくなるでしょう。発明でも、AIでできそうなところは、進歩性がないと言われることにもなる。これからは、AIを使った上で、プラスアルファの部分ができるかできないかで差が出ることになります。

君嶋

進歩性のレベルが上がってくるというお話ですが、そもそも知的財産法で著作物や発明をなぜ保護するかを考えた時、1つは創作の成果に関して、それを生み出した人に一定の報奨を与えるべきとして、その人は一定期間優遇される権利があるという考え方があります。

もう1つ大きな要素として、新しく創作されたものを社会実装につなげ、それにより社会が豊かになり、生活が便利になる。あるいは文化的に素晴らしい体験ができる。そういったことから保護をしていく面もあるわけです。

特に産業の発達を目的とする特許法の分野に関しては、発明が完成したら、すぐに社会が豊かになるかというと、そうではない。それを社会で使えるようにするためにはさらに何年もの研究開発をして製品化をしてそれを普及させていく過程があって、初めて社会に実現されていくものです。

すると、「人間が創作したから保護するのだ」という考え方だけだと、AIで自動的にできるなら保護しなくていいじゃないか、となってしまう。でも創作されたものを社会に実装するために時間やお金を投資するために、インセンティブをつくることも重要です。だから、AIだけの創作だから保護しないという従来の考え方は、再検討が必要でしょう。

AIと大学教育

君嶋

AIに従来の論文、データなどを分析・解析させるにしても、クリエイティブな部分は人間がやっていく必要がある中、慶應義塾という研究教育機関の中で、次世代の若い人たちをどのように教育していくべきか。あるいはどんな研究環境を整えるべきか。ぜひご意見をいただければと思います。

矢向さんはAIコンソーシアムの取組みを最初から見てこられましたが、簡単にご紹介いただけますか。

矢向

「AI・高度プログラミングコンソーシアム」(AIC)と言いますが、10年ぐらい前からAIがいろいろなところで話題になり、それを敏感に感じ取った学生が、AIについて学びたいと言う。

でも例えば法学部の中に機械学習の授業はない。それで、文系、理系の垣根を越えてAIに興味のある学生を集め、互いに学習し合う、学び舎の中の学び舎をつくったのです。

そこでは、得意な学生が他の学生に教えることを主としているので、われわれ後方スタッフの教員は教えるのではなく、仕組みをつくることに力を入れています。でも学生同士が触れ合う中で、教員では思いつかないような学生ならではの視点や発想も出てきているので、やってよかったという気持ちです。今、5年目に入り、活動を続けています。

君嶋

素晴らしい取組みですね。一方、AICのように単位が付かない学生の自主的な活動の場は、意識の高い学生は来ると思いますが、あまり意識が高くない、単位になるから授業は取るような学生は、そこには来ないのではないかと思います。

そこまで意識は高くないけど、実は非常にポテンシャルの高い学生はたくさんいると思うので、そこをどう教育していくのか、いつも悩むところです。

矢向

難しいですね。AICは単位を今まで出していないし、これからも単位を出すのは難しいと思っています。単位を与えるからには大学としてオーソライズし、文科省からもある程度認められないといけない。今は学生が学生を教えるという枠組みだからです。

今のところは単位にならなくてもやりたい、というとがった学生を中心に活動することでいいのかなと思っています。

君嶋

杉浦さんはまさにAI研究の研究室を運営していらっしゃいますが、教育面でどんな工夫をされていますか。

杉浦

私が学生の頃はAIの研究で就職できるようなものではなく、一部の学生が単に楽しいから取り組む分野でしたが、今はいろいろな応用で使われているので、興味を持つ学生は多いです。

学部レベルの教育での大きな変化は、今年度から理工学部の学生の大半が受講する「理工学基礎実験」という科目に、ニューラルネットワークが開講したことです。

そこで、実習形式で面白い技術があることを伝えれば、興味を示してくれる学生は増えると思います。より多くの人材に広げると同時に、専門的な内容に深く取り組んでいきたいと考えています。

君嶋

法学の分野の教育は、変わる部分はあるのでしょうか。

奥邨

今、アメリカの判例検索サービスは、皆、AI実装を売りにしています。また、日本でも、リーガルテック関係では、AIがポイントになってきています。道具としてAIを使いこなすことは、法学系でもやっていかないといけない。

また、まさに852話さんのような、コンテンツとテックを融合させた、新しいコンテンツがどんどんできていく時代なわけです。だから、知財や著作権を勉強する、研究するには、技術そのものはわからないにしても、そこに興味、関心を持って楽しいと思って取組む若い人がどんどん増えないといけないと思っています。

私としては、技術そのものを教えられるわけではないですが、新しい世の中の動きがあり、新しいトラブルも起きている。それに法学はこうやって対応していくのだというところをリアルタイムで見せることで、学生の関心を集められればと思います。若い人は、新しい技術をどんどん使えるようになりますから、法学でも、私たちが想像できないような発想でやってもらえるようにしたいですね。

君嶋

コンテンツに興味があるので知的財産法をやりたいという学生は非常に多いですね。そういう学生は、法律学科の学生でも、絵や音楽が好きだったり、プログラミングをやっていますとか様々な特技がある。伝統的な法学の勉強は憲法、民法、刑法等、六法をきっちり体系的にマスターしていくのが基本ですが、従来の教育システムで必ずしもハッピーではない学生もいて、実はそれがマジョリティーであったりします。

そういう学生は才能がないかというと、全然そんなことはない。新しい事象に関心があり、コンテンツ、ゲームがとても好きで、その業界で仕事をしたいということが法学を勉強する動機になる。また、法律学科へ入ったけれど、理工学部に行って勉強を一から教えてもらいたい、あるいはダブル・ディグリーで専門を2つやりたい、といったいろいろな教育の可能性があるように感じています。

新しいことが出てきた時、AIに任せられるところは任せてしまう。その先に、基礎知識に基づいてどう法的な問題、社会的な問題を解決するかといった発想のできる学生を育てられるといいと思うこともあります。

杉浦

まさしくそうですね。現在では、AIは多様なユーザーに使われるようになりました。ただ、AIをつくるほうは依然として情報系に偏っているので、法学などいろいろな専門家と議論する部分は重要だと思います。様々な学生に興味を持ってもらえると、教員としてはうれしいですね。

矢向

先日、AICの本年度のガイダンスをやったのですが、法学部の2年生のすごく元気な学生がいて、ガイダンスの後で長く話しました。ChatGPTだけではなく画像の生成系AIなどもすでに使っていました。

従来の教え方が合わない学生もいるというのは、流行りの言葉で言えばある種の多様性だと思っています。多様な学生を慶應義塾としてきちんと育てていくことを考えると、きちっとしたカリキュラムだけで教えるのではなく、1人1人個別の教育ができるようにしていく必要があると思います。

そのためには学生ともっと密にコミュニケーションを取り、将来やりたい希望をくみ取って、教員が持てる教育力をうまく提供してあげる教え方にシフトしていくべきと思っています。

先人の知恵を敬うこと

君嶋

852話さんから見て、大学教育に対する要望などありましたら、ぜひお願いします。

852話

生成AIのコミュニティーなどでは技術的にプログラミングを書いてAIのモデルを動かしたり、コミュニティーを実際に管理している中高生がいるのです。

これから大学でAIの分野を強化していくことは、その子たちの未来にとても役立つと思います。無料で触れられる技術だからこそ、デジタルネイティブ世代に広く広がっている。TikTok などのアプリでも、AI変換というのが画像分野、動画分野ですごく流行っていて、大人が思う以上に彼らにとっては日常のものになってきています。

下の世代は日常的に「こういう技術やこういうアプリ面白いよね、あるある」みたいにすごく身近に感じています。中学、高校で絵を描いていたけれど、技術的な方面に興味が出てきたので、それを学ぶにはどうしたらいいですかと、リアルな声が私のところにも届きます。

前向きに、教育の現場として受け入れの態勢を整えていただくのが、よい未来につながっていくのではないかと思っています。

君嶋

若い世代がどんどん活躍できる場をわれわれ大人がつくって、自由にいろいろなことを試すことができることが重要ですね。若い人たちが失敗しても温かく見守ってあげる。もうちょっとこうしたらいいのではとか、この部分をこうやると傷つく人がいるとか、社会全体が教えてあげる。あるいは一緒に行動していく。そういうことができるようになると、AIがいくらお利口になってもそれを利用してさらに楽しい、豊かな生活が送れる社会になるのでしょう。

矢向

知的財産権について思っていることが1つあります。私は法律については詳しく知りませんが、その裏にある思想は、先にそれを考えた人への表敬だろうと思うのです。

先人の知恵を敬って利用するということは、人に対する敬意が根源にあると思うので、AIが出したものについても、ここの部分はこの人のアイデアを使っていますと、きちんと表示されるようになると、AIも尊敬されるようになるかもしれないし、その裏にあった元の原作者への敬意も表せるようになる。誰のアイデアが裏にあるのかが見えるような生成系AIが出てきてくれるといいなと思います。

和歌で言うと本歌取りのような考え方で、昔の人への敬意があれば、それを借用しても作品として成り立つという文化もありますので、先人の知恵を敬うところを学生にはきちんと教えなければいけないと思っています。

君嶋

そうですね。他の人を大切にする。あるいは他の人の仕事を敬うという昔ながらの社会倫理が、ある意味、技術が発達してくればくるほど重要になってくるかもしれないですね。

本日は大変重要なお話をありがとうございました。

(2023年4月17日、三田キャンパスにて収録)

※所属・職名等は本誌発刊当時のものです。