アカウント名:
パスワード:
#1284989 [srad.jp]で示していただいた論文の共著者です.
我々が知っている元ネタは Retrieving Open Source Software Licenses [springerlink.com] です. この文献で提案されているのは,ソースコード中のコメントに対して正規表現マッチングを行うことでライセンスを特定する手法です. しかし,この手法では,ツールによる補助はあるものの正規表現のパターンを手で作らなければならないため,作業負荷が大きいという問題があります.
我々の手法は,上記のようなパターンを手で作成する代わりに,多くのソースコードのコメントに頻出する文字列を作業者に提示することで,一括してライセンスを特定しようというものです.
今回発表された FOSSology は,上記 2 つの手法のどちらとも違っているようです. 詳細をちゃんと見ていないのですが,検出したいライセンスの文面などを用意しておき,それらの文面と類似した文字列をソースコード集合から探す手法のようです.
一方,他のいくつかのコメントで示されている ProtexIP [blackducksoftware.com] は,ライセンスが既知のソースコードの一部が,手元のソースコード集合に含まれているかどうかを調べるツールですので,目的が異なります.
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
開いた括弧は必ず閉じる -- あるプログラマー
コメント中の頻出文字列を用いたソフトウェアライセンスの特定支援 (スコア:0)
どこかで似たような話を聞いたことあるなと思った
Re:コメント中の頻出文字列を用いたソフトウェアライセンスの特定支援 (スコア:0)
Re:コメント中の頻出文字列を用いたソフトウェアライセンスの特定支援 (スコア:2, 興味深い)
#1284989 [srad.jp]で示していただいた論文の共著者です.
我々が知っている元ネタは Retrieving Open Source Software Licenses [springerlink.com] です. この文献で提案されているのは,ソースコード中のコメントに対して正規表現マッチングを行うことでライセンスを特定する手法です. しかし,この手法では,ツールによる補助はあるものの正規表現のパターンを手で作らなければならないため,作業負荷が大きいという問題があります.
我々の手法は,上記のようなパターンを手で作成する代わりに,多くのソースコードのコメントに頻出する文字列を作業者に提示することで,一括してライセンスを特定しようというものです.
今回発表された FOSSology は,上記 2 つの手法のどちらとも違っているようです. 詳細をちゃんと見ていないのですが,検出したいライセンスの文面などを用意しておき,それらの文面と類似した文字列をソースコード集合から探す手法のようです.
一方,他のいくつかのコメントで示されている ProtexIP [blackducksoftware.com] は,ライセンスが既知のソースコードの一部が,手元のソースコード集合に含まれているかどうかを調べるツールですので,目的が異なります.
Re: (スコア:0)
protexIP [sios.com]とか?