アカウント名:
パスワード:
このプロジェクトって何の意味があるんですかね。とっくの昔にゾンビ化している。
MS Office互換ソフトが複数あってもいいんじゃないの?
OpenOffice/LibreOfficeってMS Office互換ソフトじゃないぞ。
同じような事ができるソフトなだけで。
そうそう、デフォルトのUTF8のcsvを読み込んでも、MS Officeのようにきれいに文字化けしたりしないもん。
でも、UTF-8とレガシーなマルチバイト(Shift_JISに限らずというか日本に限らず)ってバイト列を見ただけではどちらなのか曖昧な場合もあるからね・・
自動で判別するよりは、「UTF-8でもBOMつけろ」というスタンスでいた方がビジネスの現場では安全なのかもしれない。。。みたいな事を妄想したり。
バイト列が短い場合でも長い場合でもヒューリスティックに判断すればUTF-8とShift_JISの区別位できるはず。AIって所詮パターンマッチのことだからねぇ。
ファイル全体の中に、いわゆる日本語文字が数文字しかなくて、しかも偶々、コードのエリアが被ってる、ぐらいの狙ったようなレアケースじゃなきゃ、普通のロジックで判別は可能。AIなんて面倒なモノすら必要はない。
ほぼほぼ同意なんですが、頭数KByteぐらいASCII文字しかない多言語ファイルでも、実際には誤爆する実装は多いです。ファイル中の何カ所かサンプリングしてチェックするだけでよいはずですが、なんか泥臭いやり方なのでもっとエレガントな方法はないものか。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー
何の意味があるのか? (スコア:1)
このプロジェクトって何の意味があるんですかね。
とっくの昔にゾンビ化している。
Re: (スコア:0)
MS Office互換ソフトが複数あってもいいんじゃないの?
Re: (スコア:0)
OpenOffice/LibreOfficeってMS Office互換ソフトじゃないぞ。
同じような事ができるソフトなだけで。
Re: (スコア:-1)
そうそう、デフォルトのUTF8のcsvを読み込んでも、MS Officeのようにきれいに文字化けしたりしないもん。
Re: (スコア:0)
でも、UTF-8とレガシーなマルチバイト(Shift_JISに限らずというか日本に限らず)って
バイト列を見ただけではどちらなのか曖昧な場合もあるからね・・
自動で判別するよりは、「UTF-8でもBOMつけろ」というスタンスでいた方が
ビジネスの現場では安全なのかもしれない。。。みたいな事を妄想したり。
Re: (スコア:0)
バイト列が短い場合でも長い場合でもヒューリスティックに判断すればUTF-8とShift_JISの区別位できるはず。AIって所詮パターンマッチのことだからねぇ。
Re: (スコア:0)
ファイル全体の中に、いわゆる日本語文字が数文字しかなくて、しかも偶々、コードのエリアが被ってる、ぐらいの狙ったようなレアケースじゃなきゃ、普通のロジックで判別は可能。
AIなんて面倒なモノすら必要はない。
Re:何の意味があるのか? (スコア:0)
ほぼほぼ同意なんですが、頭数KByteぐらいASCII文字しかない多言語ファイルでも、実際には誤爆する実装は多いです。
ファイル中の何カ所かサンプリングしてチェックするだけでよいはずですが、なんか泥臭いやり方なのでもっとエレガントな方法はないものか。