アカウント名:
パスワード:
世界で初めて音声を量子化して通信したSIGSALYが1500bpsだったそうだから、3kbpsは驚くほどビットレートが低いわけじゃないな。
SIGSALYhttps://ja.wikipedia.org/wiki/SIGSALY [wikipedia.org]
フロッピー1枚に「ローマの休日」が入るのだから、今の動画はもっと圧縮できるだろ、ぐらい不思議な発言音質(クリアに聞き取れるか)の観点がスッポリ抜けている
初期のコーデックでは人が聴こえないデータを削ってギリギリまで容量減らしたのに、それから人間の耳が進化したわけでもないのにこれ以上容量や音質増やす必要あるのか?オーディオ系のオカルト並みに意味ないことやってる
減らせるのは「聞こえないデータ」だけじゃないし。ブロックサイズを大きくして圧縮効率を高めたり、今ではAIで推測補完できる範囲も見込んでデータ減らせる。
あと、特に通話向けの非可逆圧縮では「聞こえるけど影響が少ないって判断したデータ」も削除してるので、普通に聞いても音質が劣化してる。
> AIで推測補完できる範囲も見込んであまりイメージがわかないんだけど、再生にAIが必要ってこと?
データを受信してからゼロから学習する訳ではないので。何をAIと見なすかは人によりけりだが、再生に「何か特別」なものが必要という話ではない。
あと1対多の放送・配信用途だと、エンコードの負荷を大きくしてデコードの負荷を小さくするという戦略が有効だけど少数グループでの双方向通話ではあまり意味をなさない。なので、再生だけでなく録音側もベースラインは同様なはず。
再生機の補正技術とかを計算の範囲に入れて「補正された後に出る音」を目的に別の音をAIで作る技術もあるしね。
あと圧縮とはちょっと違うが「ニセレゾ」とか呼ばれてる音源は、過去の録音技術で失われる成分を学習して補完してる。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家
3kbps (スコア:0)
世界で初めて音声を量子化して通信したSIGSALYが1500bpsだったそうだから、3kbpsは驚くほどビットレートが低いわけじゃないな。
SIGSALY
https://ja.wikipedia.org/wiki/SIGSALY [wikipedia.org]
Re: (スコア:0)
フロッピー1枚に「ローマの休日」が入るのだから、今の動画はもっと圧縮できるだろ、ぐらい不思議な発言
音質(クリアに聞き取れるか)の観点がスッポリ抜けている
Re: (スコア:0)
初期のコーデックでは人が聴こえないデータを削ってギリギリまで容量減らしたのに、それから人間の耳が進化したわけでもないのにこれ以上容量や音質増やす必要あるのか?
オーディオ系のオカルト並みに意味ないことやってる
Re: (スコア:0)
減らせるのは「聞こえないデータ」だけじゃないし。
ブロックサイズを大きくして圧縮効率を高めたり、今ではAIで推測補完できる範囲も見込んでデータ減らせる。
あと、特に通話向けの非可逆圧縮では「聞こえるけど影響が少ないって判断したデータ」も削除してるので、
普通に聞いても音質が劣化してる。
Re: (スコア:0)
> AIで推測補完できる範囲も見込んで
あまりイメージがわかないんだけど、再生にAIが必要ってこと?
Re: (スコア:0)
データを受信してからゼロから学習する訳ではないので。
何をAIと見なすかは人によりけりだが、
再生に「何か特別」なものが必要という話ではない。
あと1対多の放送・配信用途だと、エンコードの負荷を大きくして
デコードの負荷を小さくするという戦略が有効だけど
少数グループでの双方向通話ではあまり意味をなさない。
なので、再生だけでなく録音側もベースラインは同様なはず。
Re:3kbps (スコア:0)
再生機の補正技術とかを計算の範囲に入れて「補正された後に出る音」を目的に別の音をAIで作る技術もあるしね。
あと圧縮とはちょっと違うが「ニセレゾ」とか呼ばれてる音源は、過去の録音技術で失われる成分を学習して補完してる。