アカウント名:
パスワード:
SFC的にはGPLのコードを学習させて作ったAIはGPLで公開しないといけないけど、Githubはそれをしていないってからアウトってこと?
それより、そのAIが生成したコードこそGPL(他)にしないといけなさそうだけど、そんなのお遊びでしか使えなくね?
いま各国で法整備が進んでいて、ネットから集めたデータで学習させたAIは元データをすごく抽象化して知的な理解を構築しているのでもはやネタ元の著作権とかありえん、という方向に向かってます。実際に絵とか写真だとデータが膨大すぎて誰も検証できておらずその建前が通りつつあるのですが、テキストに関してはうまく喋らせるとソースを一語一句違えず吐くのでこれヤバいんじゃ…? という懸念が広がってます。
で、その懸念が高まってついにGItHubから逃げたプロジェクトが出たのがこの一件です。成り行きによってはネットから拾った絵をカオスラウンジする諸処のAIが一緒に滅びるか、または逆に合法化します。
画像分類用DNNの敵対的サンプル(≒DNNが内包する〇〇らしい画像)は人間には理解不能な砂嵐ではあるけど、抽象化されてるっていうか人間には判別困難な特徴量(特に質感周り)などを直で拾ってるような印象。
画像系のDNNも強い相関のあるピクセルグループ単位でなら元データを吐き出すのではないかな。画像分類だと画像は元データが1サンプルあたりでも多めで保持すべき分類の空間も狭いから部分構造が抽出できても元絵が取れたと判断しにくく問題になりにくいだろうとは思うけれど。紙幣のユーリオンや繰り返し構造になってるステガノグラフィみたいな部分構造は取れそうな気がする。学習元が3DCGなら有償アセットのテクスチャとかを取り出せるケースもありそう。
コード生成だと保持される分類の空間も広くてサンプル同士が融合しにくく、同一だと数行どころか最悪1行でも完コピと判別できるので目立つけど根本は画像でも同じ事になっているんじゃないかな。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
GPLとAI (スコア:0)
SFC的にはGPLのコードを学習させて作ったAIはGPLで公開しないといけないけど、Githubはそれをしていないってからアウトってこと?
それより、そのAIが生成したコードこそGPL(他)にしないといけなさそうだけど、そんなのお遊びでしか使えなくね?
Re: (スコア:2)
いま各国で法整備が進んでいて、ネットから集めたデータで学習させたAIは元データをすごく抽象化して知的な理解を構築しているのでもはやネタ元の著作権とかありえん、という方向に向かってます。実際に絵とか写真だとデータが膨大すぎて誰も検証できておらずその建前が通りつつあるのですが、テキストに関してはうまく喋らせるとソースを一語一句違えず吐くのでこれヤバいんじゃ…? という懸念が広がってます。
で、その懸念が高まってついにGItHubから逃げたプロジェクトが出たのがこの一件です。成り行きによってはネットから拾った絵をカオスラウンジする諸処のAIが一緒に滅びるか、または逆に合法化します。
Re:GPLとAI (スコア:0)
画像分類用DNNの敵対的サンプル(≒DNNが内包する〇〇らしい画像)は人間には理解不能な砂嵐ではあるけど、
抽象化されてるっていうか人間には判別困難な特徴量(特に質感周り)などを直で拾ってるような印象。
画像系のDNNも強い相関のあるピクセルグループ単位でなら元データを吐き出すのではないかな。
画像分類だと画像は元データが1サンプルあたりでも多めで保持すべき分類の空間も狭いから
部分構造が抽出できても元絵が取れたと判断しにくく問題になりにくいだろうとは思うけれど。
紙幣のユーリオンや繰り返し構造になってるステガノグラフィみたいな部分構造は取れそうな気がする。
学習元が3DCGなら有償アセットのテクスチャとかを取り出せるケースもありそう。
コード生成だと保持される分類の空間も広くてサンプル同士が融合しにくく、
同一だと数行どころか最悪1行でも完コピと判別できるので目立つけど
根本は画像でも同じ事になっているんじゃないかな。