「GitHub Copilotはオープンソースライセンスを侵害」OSS開発者が集団訴訟を開始 50
ストーリー by nagazou
訴訟 部門より
訴訟 部門より
GitHubのコードを学習データとして用いたAIコード補完サービス「GitHub Copilot」が訴訟の対象となったそうだ(GitHub Copilot litigation、Joseph Saveri法律事務所、GIGAZINE)。
GitHubとその親会社であるMicrosoft、開発に携わったOpenAIに対して集団訴訟が提起された。記事によればAI生成サービスにまつわる訴訟はこれが初めてらしい。訴状によればMITライセンス、GPL、およびApacheライセンスなど11の一般的なオープンソースライセンスでは、作者の名前と著作権の帰属表記が必要だと主張。しかし、GitHub Copilotではこれらのライセンスの帰属要件に違反しているうえ、月額10ドル(約1480円)または年額100ドル(約1万4800円)のサービスを展開、運営者らはオープンソースライセンスを侵害し、さらにはオープンソースプログラマーの仕事から利益を得ていると主張している。
あるAnonymous Coward 曰く、
GitHubとその親会社であるMicrosoft、開発に携わったOpenAIに対して集団訴訟が提起された。記事によればAI生成サービスにまつわる訴訟はこれが初めてらしい。訴状によればMITライセンス、GPL、およびApacheライセンスなど11の一般的なオープンソースライセンスでは、作者の名前と著作権の帰属表記が必要だと主張。しかし、GitHub Copilotではこれらのライセンスの帰属要件に違反しているうえ、月額10ドル(約1480円)または年額100ドル(約1万4800円)のサービスを展開、運営者らはオープンソースライセンスを侵害し、さらにはオープンソースプログラマーの仕事から利益を得ていると主張している。
あるAnonymous Coward 曰く、
確かにAI学習にオープンソースのコードを使用しており、出力されるソースコードもコピペ感があるものが多い状況だが、果たしてこれがOSSライセンス侵害と認められるか?議論を呼びそうである。
ライセンスロンダリングツール (スコア:2, おもしろおかしい)
面倒なGPLもGitHub Copilotを通せばこんなにきれいに!
Re: (スコア:0)
マジな話そうなる未来もありうる。
商用含めた非GPL互換なコードもGPL化するコピーレフトも捗る事になる。
Re: (スコア:0)
GPLv4かAGPLのような派生ライセンスができるオチ
Re: (スコア:0)
AIには使わせないとか? 将来根に持ったAIから人間には使わせないライセンス作られそう。
Re: (スコア:0)
OSSは著作権法を根拠にライセンスを守らせるから、著作権で制限できない使用方法はライセンスの意味ないぞ。
AI学習禁止ライセンス作ろうが、例えば日本ならガン無視できる。
Re: (スコア:0)
AIに学習させるには、ソースコードを複製してきてAIに読み込ませなきゃならんでしょ。
この時点の複製がすでに著作権に引っかかるだろうに。
Re: (スコア:0)
複製がアウトがどうかは用途次第
一律アウトなら引用すら出来なくなる
Re: (スコア:0)
現時点でそれが著作権の侵害になると確定してる国ってある?
まだ判断が下されたことがないところばかりじゃないかな。
日本みたいに例外条項作られて侵害にならないと確定してる国もあるわけだし。
Re: (スコア:0)
それ1歩でも他国に持っていったらアウトでは
審議の必要はあるが議論の余地はなくね? (スコア:1)
・サービス自体がモデルとしてGitHubの個人ソースを利用
・流用ソースの作者の名前と著作権の帰属表記がない
ライセンス違反に疑問の余地はないかと
オープンソースプログラマーの仕事から利益を得ていること自体に対しては許容されているがライセンス表記なしでは違反
これに対し賠償を認めるか否かの審議でしかないんじゃないかな
Re:審議の必要はあるが議論の余地はなくね? (スコア:1)
フェアユース絡みで、機械学習で出来たデータセットとその成果物に適用できるかがネック。
リバースエンジニアリングのクリーンルーム設計ライセンスが引き継がれないのと似てる。
ある意味ではAIお絵かきとかと同根。
Re: (スコア:0)
GitHub Copilotとお絵描きAIが明確に違うのは、Copilotは学習元のコードそのものが出力されることがある。
それが出力されたときに、ライセンス違反になる可能性はあるんだろうけど
違反者はAIの利用者であって、Copilotそれ自体がライセンス違反という主張は無理があると思うわ。
Re: (スコア:0)
その辺の差異はモデルの学習量の差かモデル化辺りの差と思っているので、じゃあどの程度のやれば?ってラインが決まるかもとは思ってる。
Re: (スコア:0)
学習に使う分には著作権の影響は及ばないんじゃないの?
そやなかったら文章や画像の生成AIもダメってことになっちゃうやん
日本では大丈夫と聞くが、ヘロッと検索した感じだとアメリカじゃダメなんかな
https://www.jstage.jst.go.jp/article/jjsai/36/6/36_745/_pdf [jst.go.jp]
Re: (スコア:0)
文章や画像の生成AIもセーフだとは確定してなかった気が。それに単にAIの学習に使うだけなのと、そうやって学習したAIをサービスとして提供するのとでも違ってくると思う。
Re: Re:審議の必要はあるが議論の余地はなくね? (スコア:1)
無断で他者の特許を使って研究開発するのは問題ないが、それで商品を作るのは問題なのと同じかな。
まずは使って評価して使えるならライセンス契約を結ぶことができるよう、特許法はそうなっている。
特許法の目的は、知識を広く使われるようにすることで公共の利益を大きくすること。
そのために、知識が公開されやすいように、知識を保護している。保護は目的でなく手段。
知識に財産権が絡むのは、知識に価値を認めない考えに対する回答の一つなので、法の実装が分かれる。
Re: (スコア:0)
学習に使っても良いとしても、結果ほとんどコピペなコードを出したらあかんと思うが。
絵でも同じじゃない?
Re: (スコア:0)
コードでも絵でも、AIが出力することそのものがダメかどうかは議論の余地あるんじゃないかな。
模倣にしろ剽窃にしろ、問題視されるのはそれを公開する段階でのことだよね。
作成した段階でアウトという話をする場合、AIによる出力だけがなぜ公開を伴わない作成でも禁止され得るのかの理屈が要るかと。
Re: (スコア:0)
そりゃあ、はじめから言っておかないと、巧妙に隠せるようになったり、あるいは野放しにして、事実上制限がかけられないようになる前に、予防線を張る。
IT関係ってやったもんがちの歴史があるし。
Re: (スコア:0)
出力自体は良くても、使う時点でOSSから引っ張ってきたらライセンス表記は必要じゃないの?
自社内部で使う場合でも。
で、このAIの問題点は、
・プログラマが候補となるコードが出てきても、そのコードの出元が分からんから、ライセンス表記を記載しようがない。
・自分で書いたと言い張れば、OSSのコードを自分の所有にできる。
ってところじゃない?
Re: (スコア:0)
Githubとしても裁判で決着つけようぜって感じなのかも。
Re: (スコア:0)
> 裁判で決着
つーても国ごとに違う決着になるだろうから、最悪おま国されそう。
Re: (スコア:0)
AIの処理エンジンとしての出力が、オリジナルを論理的に追跡不可能なレベルで細断したものからのものである場合、
(CopilotがそのレベルのAIであるかは知らないがそうである場合)
出力されたソースに元ソースの著作性は残っていることになるのだろうか。
人が行った場合でも、コピペと、以前作例を学んだコードからの模倣というか参考というか?は別の行為と考えられているはず。
AIであることとは無関係に、コピペ的であるかが分水嶺となるべきかもと。
DeepLとかは学習データをWeb上から取得しているようだが…
Re: (スコア:0)
難読化ツールとか通したらどうなるんでしょうね
つかそもそもソースを公開しなければ良いのか
うーん訴えられそうな気もするし、ソースを公開せずに何かに混ぜれば判らない、とかはCopilot使わなくても同じだし・・・
Re: (スコア:0)
ソフトウェアの著作権に関してはそんなに簡単な問題じゃないよ。
特許は20年と短いし認められる幅も狭い代わりに強い権利だから、侵害に対しても強い。
一方、著作権は死後50年と長いし広範にに見える代わりに弱い権利なので、侵害に対して強くない。
例え元の著作者のいうライセンスに違反していたとしても、著作権を本当に侵害しているかどうか、もっと言えば元のコードが法律の言う著作物と認められうかどうかは争ってみないと分からない部分も多い。
コード全体の丸ごとコピーなら明らかな違反だと言える場合は多いけど、部分的なコピーだとそれが著作物と言えるのか、それとも技術的な必然であるのか、争ってみないと中々簡単に結果は言えない。
Re: (スコア:0)
なんかちょっとでも使われてたら訴えてやるとか息巻いてる人もいますがまさにそれが気になっています。
ライセンスは断片的な使用にまで制限を課せるのか、関数程度の規模のものに排他的に使用できる権利が認められるのか。
そんなものに排他的使用権が認められたら、プログラム開発なんてまともにできる産業ではなくなってしまいそうだけど。
Re: (スコア:0)
AI以前にOracleとGoogleのJava関連訴訟の時に少さなコードのコピーがあってそれがOKとかNGとか判断どっちもあったように思う
ちがったらすまないけど
Re: (スコア:0)
訴訟までは行ってないですが、弁理士に相談したことは何度かあります。
数行とか関数程度なら、技術的な必然であると判断される可能性が高そうでした。
(訴訟してみないと確定では無いので、言い切ってはくれないけど)
例え変数名が一致していても、それが「作品として表現したもの」と言えるわけではないようです。
公開していないコードであれば、著作権よりも営業秘密の侵害として不正競争防止法で戦ったほうがまだ目がありそうな感じ。
Re: (スコア:0)
おおなるほど。
勉強になります。ありがとうございます🙏
著作権は妥当じゃないだろうと考えていましたが、不正競争防止法でというなら確かにめがありそうだと思えました。
元ソースコードの完全な切り貼りが出てくるので著作権的にはアウトにきまっておろう (スコア:1)
元のソースコードの一部(関数丸ごととか)がそのまま出てくる例が結構あって、Github 内でユニークな関数名や変数名、コメントが補完されている実例がたくさんあります。公式の説明でも 0.1% ぐらいの補完候補はそのような補完候補であるようなので、
https://twitter.com/hiromichinomata/status/1410009065594363908 [twitter.com]
裁判になったら絶対に負けるでしょうね。あと、私には真偽が判定できないが、GitHub のプライベートリポジトリにしか存在していないコード片が補完候補で出てくるという訴えを Twitter でいくつも見るので、GPL なコードを学習に入れていないし verbatim な補完候補を出さない TabNine を業務では使っとけ。
Re: (スコア:0)
0.1%の確率でGPL汚染だと..!? これはストールマンの罠だ!
土方の (スコア:0)
土方に因る、土方レベルの案件なのか?
これは日本の話ではありません (スコア:0)
この手のアメリカの話は毎回日本の法律振りかざして語るコメントが現れる
Re: (スコア:0)
GitHub Copilotって日本ではサービスしてないんだっけ? 日本でも同様の訴訟を起こせるか考察する意味はあると思うが
完全なコピペがあるなら訴えられても仕方ない (スコア:0)
ただコピーと断言できるものでないなら、オープンソースのコード見て勉強した人間が非常に「似た」コードを書くのと変わらないのかも
Re: (スコア:0)
「そうとしか書けない」とか、「(たとえば)GPLなソースコードで学んだテクニックだが、LGPLなソースでも普通に使われるテクニック」とか、
そういうのでなければ、コミュニティにガタガタされる余地が出る。
Re: (スコア:0)
i++;
は俺のコードだからパクるなよ。
Re: (スコア:0)
B言語を作ったトンプソンさんのコードです。
Hello worldはリチャーズ先生のコードだろうか。BCPLが最初なのは確か。
リチャーズ先生、2018年になってもまだBCPLの更新を続けているのね。
コピペ&AI整形ツールで良い気もする (スコア:0)
生産者表示もできるようにして複数候補から選択して自プロジェクトに合うように整形する
動画PV報酬みたいに生成回数で報酬分配する形にする
個人がソフトやライブラリの成果物を完成させて収益システム構築する手間に比べれば
圧倒的に楽だし普通に市場ができるんじゃないか
マイナー機能のコーディングも進むだろうし
ガタガタ言うなら (スコア:0)
公開するな
Re: (スコア:0)
みんなライセンスの話をしてるんだけど、お前は何の話をしてるんだ?
Re: (スコア:0)
だから公開するなら権利を主張するな。
Re: (スコア:0)
なんで特許とかあるんだろうね?
この人たち (スコア:0)
今後ずっと同じようなものが出る限り世界中で訴訟を起こし続けるの?
githubがやらないなら他がやるだけだよ?
Re: (スコア:0)
つかいずれは、えーあいが全部書いてくれるような気がする
ライセンスに抵触しないでかもしれないコードも書くかもしれんし、
それに対する訴訟用の文面すら書いてくれるやもだ
AIの問題 (スコア:0)
学習に使われない権利と、使った時に(ライセンスで定められてる場合)出典を示す義務をきちんと果たせてるAIはどれだけあるんだろうか?
でも日本の法律では世間に転がってる物を学習する事自体は合法だし前者は守れない
ただ後者はこれみたいにライセンスの問題を上げれば文句付けられるし、今後クリエイターを守る手法として上手く使えそう
Re: (スコア:0)
後者の「使った時」ってこういうケースに対応できるような「使う」の定義がライセンス文章内でなされてるんだろうか?
Microsoftのせいじゃね? (スコア:0)
AppleがGitHubを買収していれば、訴訟なんて起こされなかった
Re: (スコア:0)
おっしゃるとりです。AppleがGitHubを買収していれば、レポジトリのソースコードはAppleが自由に使っていいライセンスにしたはず。
なぜライセンス限定しなかったんだろう (スコア:0)
どうして MIT や BSD、Apache ライセンスだけで学習しなかったんだろう
それで解決する気がするんだけど