パスワードを忘れた? アカウント作成
15984100 story
法廷

「GitHub Copilotはオープンソースライセンスを侵害」OSS開発者が集団訴訟を開始 49

ストーリー by nagazou
訴訟 部門より
GitHubのコードを学習データとして用いたAIコード補完サービス「GitHub Copilot」が訴訟の対象となったそうだ(GitHub Copilot litigationJoseph Saveri法律事務所GIGAZINE)。

GitHubとその親会社であるMicrosoft、開発に携わったOpenAIに対して集団訴訟が提起された。記事によればAI生成サービスにまつわる訴訟はこれが初めてらしい。訴状によればMITライセンス、GPL、およびApacheライセンスなど11の一般的なオープンソースライセンスでは、作者の名前と著作権の帰属表記が必要だと主張。しかし、GitHub Copilotではこれらのライセンスの帰属要件に違反しているうえ、月額10ドル(約1480円)または年額100ドル(約1万4800円)のサービスを展開、運営者らはオープンソースライセンスを侵害し、さらにはオープンソースプログラマーの仕事から利益を得ていると主張している。

あるAnonymous Coward 曰く、

確かにAI学習にオープンソースのコードを使用しており、出力されるソースコードもコピペ感があるものが多い状況だが、果たしてこれがOSSライセンス侵害と認められるか?議論を呼びそうである。

  • by Anonymous Coward on 2022年11月07日 13時20分 (#4355776)

    面倒なGPLもGitHub Copilotを通せばこんなにきれいに!

    ここに返信
    • by Anonymous Coward

      マジな話そうなる未来もありうる。
      商用含めた非GPL互換なコードもGPL化するコピーレフトも捗る事になる。

    • by Anonymous Coward

      GPLv4かAGPLのような派生ライセンスができるオチ

      • by Anonymous Coward

        AIには使わせないとか? 将来根に持ったAIから人間には使わせないライセンス作られそう。

        • by Anonymous Coward

          OSSは著作権法を根拠にライセンスを守らせるから、著作権で制限できない使用方法はライセンスの意味ないぞ。
          AI学習禁止ライセンス作ろうが、例えば日本ならガン無視できる。

          • by Anonymous Coward

            AIに学習させるには、ソースコードを複製してきてAIに読み込ませなきゃならんでしょ。
            この時点の複製がすでに著作権に引っかかるだろうに。

            • by Anonymous Coward

              複製がアウトがどうかは用途次第
              一律アウトなら引用すら出来なくなる

            • by Anonymous Coward

              現時点でそれが著作権の侵害になると確定してる国ってある?
              まだ判断が下されたことがないところばかりじゃないかな。
              日本みたいに例外条項作られて侵害にならないと確定してる国もあるわけだし。

  • by Anonymous Coward on 2022年11月07日 12時11分 (#4355747)

    ・サービス自体がモデルとしてGitHubの個人ソースを利用
    ・流用ソースの作者の名前と著作権の帰属表記がない
    ライセンス違反に疑問の余地はないかと

    オープンソースプログラマーの仕事から利益を得ていること自体に対しては許容されているがライセンス表記なしでは違反
    これに対し賠償を認めるか否かの審議でしかないんじゃないかな

    ここに返信
    • by Anonymous Coward on 2022年11月07日 12時42分 (#4355760)

      フェアユース絡みで、機械学習で出来たデータセットとその成果物に適用できるかがネック。
      リバースエンジニアリングのクリーンルーム設計ライセンスが引き継がれないのと似てる。
      ある意味ではAIお絵かきとかと同根。

      • by Anonymous Coward

        GitHub Copilotとお絵描きAIが明確に違うのは、Copilotは学習元のコードそのものが出力されることがある。

        それが出力されたときに、ライセンス違反になる可能性はあるんだろうけど
        違反者はAIの利用者であって、Copilotそれ自体がライセンス違反という主張は無理があると思うわ。

        • by Anonymous Coward

          その辺の差異はモデルの学習量の差かモデル化辺りの差と思っているので、じゃあどの程度のやれば?ってラインが決まるかもとは思ってる。

    • by Anonymous Coward

      学習に使う分には著作権の影響は及ばないんじゃないの?
      そやなかったら文章や画像の生成AIもダメってことになっちゃうやん

      日本では大丈夫と聞くが、ヘロッと検索した感じだとアメリカじゃダメなんかな
      https://www.jstage.jst.go.jp/article/jjsai/36/6/36_745/_pdf [jst.go.jp]

      • by Anonymous Coward

        文章や画像の生成AIもセーフだとは確定してなかった気が。それに単にAIの学習に使うだけなのと、そうやって学習したAIをサービスとして提供するのとでも違ってくると思う。

        • by Anonymous Coward on 2022年11月07日 15時01分 (#4355840)

          無断で他者の特許を使って研究開発するのは問題ないが、それで商品を作るのは問題なのと同じかな。
          まずは使って評価して使えるならライセンス契約を結ぶことができるよう、特許法はそうなっている。
          特許法の目的は、知識を広く使われるようにすることで公共の利益を大きくすること。
          そのために、知識が公開されやすいように、知識を保護している。保護は目的でなく手段。
          知識に財産権が絡むのは、知識に価値を認めない考えに対する回答の一つなので、法の実装が分かれる。

      • by Anonymous Coward

        学習に使っても良いとしても、結果ほとんどコピペなコードを出したらあかんと思うが。
        絵でも同じじゃない?

        • by Anonymous Coward

          コードでも絵でも、AIが出力することそのものがダメかどうかは議論の余地あるんじゃないかな。
          模倣にしろ剽窃にしろ、問題視されるのはそれを公開する段階でのことだよね。
          作成した段階でアウトという話をする場合、AIによる出力だけがなぜ公開を伴わない作成でも禁止され得るのかの理屈が要るかと。

          • by Anonymous Coward

            そりゃあ、はじめから言っておかないと、巧妙に隠せるようになったり、あるいは野放しにして、事実上制限がかけられないようになる前に、予防線を張る。
            IT関係ってやったもんがちの歴史があるし。

          • by Anonymous Coward

            出力自体は良くても、使う時点でOSSから引っ張ってきたらライセンス表記は必要じゃないの?
            自社内部で使う場合でも。
            で、このAIの問題点は、
            ・プログラマが候補となるコードが出てきても、そのコードの出元が分からんから、ライセンス表記を記載しようがない。
            ・自分で書いたと言い張れば、OSSのコードを自分の所有にできる。
            ってところじゃない?

    • by Anonymous Coward

      Githubとしても裁判で決着つけようぜって感じなのかも。

      • by Anonymous Coward

        > 裁判で決着
         
        つーても国ごとに違う決着になるだろうから、最悪おま国されそう。

    • by Anonymous Coward

      AIの処理エンジンとしての出力が、オリジナルを論理的に追跡不可能なレベルで細断したものからのものである場合、
      (CopilotがそのレベルのAIであるかは知らないがそうである場合)
      出力されたソースに元ソースの著作性は残っていることになるのだろうか。
      人が行った場合でも、コピペと、以前作例を学んだコードからの模倣というか参考というか?は別の行為と考えられているはず。
      AIであることとは無関係に、コピペ的であるかが分水嶺となるべきかもと。

      DeepLとかは学習データをWeb上から取得しているようだが…

      • by Anonymous Coward

        難読化ツールとか通したらどうなるんでしょうね

        つかそもそもソースを公開しなければ良いのか

        うーん訴えられそうな気もするし、ソースを公開せずに何かに混ぜれば判らない、とかはCopilot使わなくても同じだし・・・

    • by Anonymous Coward

      ソフトウェアの著作権に関してはそんなに簡単な問題じゃないよ。
      特許は20年と短いし認められる幅も狭い代わりに強い権利だから、侵害に対しても強い。
      一方、著作権は死後50年と長いし広範にに見える代わりに弱い権利なので、侵害に対して強くない。

      例え元の著作者のいうライセンスに違反していたとしても、著作権を本当に侵害しているかどうか、もっと言えば元のコードが法律の言う著作物と認められうかどうかは争ってみないと分からない部分も多い。
      コード全体の丸ごとコピーなら明らかな違反だと言える場合は多いけど、部分的なコピーだとそれが著作物と言えるのか、それとも技術的な必然であるのか、争ってみないと中々簡単に結果は言えない。

      • by Anonymous Coward

        なんかちょっとでも使われてたら訴えてやるとか息巻いてる人もいますがまさにそれが気になっています。
        ライセンスは断片的な使用にまで制限を課せるのか、関数程度の規模のものに排他的に使用できる権利が認められるのか。
        そんなものに排他的使用権が認められたら、プログラム開発なんてまともにできる産業ではなくなってしまいそうだけど。

        • by Anonymous Coward

          AI以前にOracleとGoogleのJava関連訴訟の時に少さなコードのコピーがあってそれがOKとかNGとか判断どっちもあったように思う
          ちがったらすまないけど

        • by Anonymous Coward

          訴訟までは行ってないですが、弁理士に相談したことは何度かあります。
          数行とか関数程度なら、技術的な必然であると判断される可能性が高そうでした。
          (訴訟してみないと確定では無いので、言い切ってはくれないけど)

          例え変数名が一致していても、それが「作品として表現したもの」と言えるわけではないようです。
          公開していないコードであれば、著作権よりも営業秘密の侵害として不正競争防止法で戦ったほうがまだ目がありそうな感じ。

          • by Anonymous Coward

            おおなるほど。
            勉強になります。ありがとうございます🙏

            著作権は妥当じゃないだろうと考えていましたが、不正競争防止法でというなら確かにめがありそうだと思えました。

  • 元のソースコードの一部(関数丸ごととか)がそのまま出てくる例が結構あって、Github 内でユニークな関数名や変数名、コメントが補完されている実例がたくさんあります。公式の説明でも 0.1% ぐらいの補完候補はそのような補完候補であるようなので、

    https://twitter.com/hiromichinomata/status/1410009065594363908 [twitter.com]

    裁判になったら絶対に負けるでしょうね。あと、私には真偽が判定できないが、GitHub のプライベートリポジトリにしか存在していないコード片が補完候補で出てくるという訴えを Twitter でいくつも見るので、GPL なコードを学習に入れていないし verbatim な補完候補を出さない TabNine を業務では使っとけ。

    ここに返信
    • by Anonymous Coward

      0.1%の確率でGPL汚染だと..!? これはストールマンの罠だ!

  • by Anonymous Coward on 2022年11月07日 12時18分 (#4355749)

    土方に因る、土方レベルの案件なのか?

    ここに返信
  • by Anonymous Coward on 2022年11月07日 12時18分 (#4355750)

    この手のアメリカの話は毎回日本の法律振りかざして語るコメントが現れる

    ここに返信
    • by Anonymous Coward

      GitHub Copilotって日本ではサービスしてないんだっけ? 日本でも同様の訴訟を起こせるか考察する意味はあると思うが

  • by Anonymous Coward on 2022年11月07日 12時50分 (#4355764)

    ただコピーと断言できるものでないなら、オープンソースのコード見て勉強した人間が非常に「似た」コードを書くのと変わらないのかも

    ここに返信
    • by Anonymous Coward

      「そうとしか書けない」とか、「(たとえば)GPLなソースコードで学んだテクニックだが、LGPLなソースでも普通に使われるテクニック」とか、
      そういうのでなければ、コミュニティにガタガタされる余地が出る。

    • by Anonymous Coward

      i++;
      は俺のコードだからパクるなよ。

      • by Anonymous Coward

        B言語を作ったトンプソンさんのコードです。
        Hello worldはリチャーズ先生のコードだろうか。BCPLが最初なのは確か。
        リチャーズ先生、2018年になってもまだBCPLの更新を続けているのね。

  • by Anonymous Coward on 2022年11月07日 17時06分 (#4355912)

    生産者表示もできるようにして複数候補から選択して自プロジェクトに合うように整形する
    動画PV報酬みたいに生成回数で報酬分配する形にする

    個人がソフトやライブラリの成果物を完成させて収益システム構築する手間に比べれば
    圧倒的に楽だし普通に市場ができるんじゃないか
    マイナー機能のコーディングも進むだろうし

    ここに返信
  • by Anonymous Coward on 2022年11月07日 18時36分 (#4355981)

    公開するな

    ここに返信
    • by Anonymous Coward

      みんなライセンスの話をしてるんだけど、お前は何の話をしてるんだ?

      • by Anonymous Coward

        だから公開するなら権利を主張するな。

        • by Anonymous Coward

          なんで特許とかあるんだろうね?

  • by Anonymous Coward on 2022年11月07日 20時06分 (#4356032)

    今後ずっと同じようなものが出る限り世界中で訴訟を起こし続けるの?
    githubがやらないなら他がやるだけだよ?

    ここに返信
    • by Anonymous Coward

      つかいずれは、えーあいが全部書いてくれるような気がする

      ライセンスに抵触しないでかもしれないコードも書くかもしれんし、
      それに対する訴訟用の文面すら書いてくれるやもだ

  • by Anonymous Coward on 2022年11月07日 21時59分 (#4356081)

    学習に使われない権利と、使った時に(ライセンスで定められてる場合)出典を示す義務をきちんと果たせてるAIはどれだけあるんだろうか?

    でも日本の法律では世間に転がってる物を学習する事自体は合法だし前者は守れない
    ただ後者はこれみたいにライセンスの問題を上げれば文句付けられるし、今後クリエイターを守る手法として上手く使えそう

    ここに返信
    • by Anonymous Coward

      後者の「使った時」ってこういうケースに対応できるような「使う」の定義がライセンス文章内でなされてるんだろうか?

  • by Anonymous Coward on 2022年11月08日 8時06分 (#4356149)

    AppleがGitHubを買収していれば、訴訟なんて起こされなかった

    ここに返信
    • by Anonymous Coward

      おっしゃるとりです。AppleがGitHubを買収していれば、レポジトリのソースコードはAppleが自由に使っていいライセンスにしたはず。

  • by Anonymous Coward on 2022年11月09日 18時11分 (#4357263)

    どうして MIT や BSD、Apache ライセンスだけで学習しなかったんだろう
    それで解決する気がするんだけど

    ここに返信
typodupeerror

ソースを見ろ -- ある4桁UID

読み込み中...