パスワードを忘れた? アカウント作成
17401242 story
テクノロジー

Preferred NetworksがOSSの大規模言語モデルを公開 12

ストーリー by nagazou
公開 部門より
Preferred Networksは9月28日、大規模言語モデルであるPLaMo-13Bを公開した。PLaMo-13Bは、日本発の大規模な事前学習済み言語モデル(LLM)で、約130億のパラメータを持ち、日本語と英語に特化している。これまで日本語対応のLLMが少なかったため、日本国内での利用に適しているとされている(PLaMo-13Bを公開しましたWEEL)。

PLaMo-13BはApache License Version 2.0のオープンソースソフトウェアとして提供されており、研究や商用利用が可能。性能は、他の同規模のLLMと比較しても優れており、日本語と英語のベンチマークスコアでも高い評価を受けている。この性能は、日本語データセットと英語データセットの効果的な学習、および130億のパラメータを持つことによるものとされている。

あるAnonymous Coward 曰く、

またAI界隈の自称OSSかと思って見に行ったらApache License 2.0なのでガチのOSSライセンスだった。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2023年10月05日 6時49分 (#4540571)

    Plamo Linuxで開発しているのかな

  • by Anonymous Coward on 2023年10月05日 6時55分 (#4540574)

    デカそう

  • by Anonymous Coward on 2023年10月05日 10時47分 (#4540679)

    そういう触れ込みのモデルはこれまでもいくつか出てきてたけど、実際にすごいかというとね...
    まあどっちかというと日本語まですごいChatGPTの方がおかしいんだよなぁ。なんなのあれ。

    • by Anonymous Coward

      理屈も口調も明らかに日本語・日本ネイティブじゃないのがなあ…
      あれがベストであり続けるとヤバいよなあ…

      • by Anonymous Coward

        そんなのブロンプトで好きにカスタマイズできるじゃん。

        • by Anonymous Coward

          ブロンド好きにカスタマイズできるじゃん?!
          そりゃ英語学習もすすむわ!
          違った

    • by Anonymous Coward

      研究者たちも首をひねっているようですよ。

      「どうして賢い振る舞いが突然できるようになったのか。なぜ日本語が自然なのか、研究者にもわかっていない」
       AI研究者の黒橋禎夫・国立情報学研究所(NII)所長はそう話す。
      https://www.asahi.com/sp/articles/ASR946JN9R8RULBH01B.html [asahi.com]

  • by Anonymous Coward on 2023年10月05日 12時44分 (#4540735)

    日本の各社からLLMが公開されているけど、どれも「日本語で訓練しました」っていうのがセールスポイントで、
    その日本語性能も既存のモデルより優れているわけでもないという…。

    開発にあたって現場レベルのノウハウはたくさんあるだろうから、
    とりあえず作ってみてノウハウを蓄積することに意味はあるとは思うけど、税金も投入されているんだし、
    世界レベルで新しいことに挑戦するプロジェクトが出てくることを期待したい。

  • by Anonymous Coward on 2023年10月06日 8時06分 (#4541102)

    Tacotron2とかEdittsでエロ音声合成しているけど
    Python36とか古いバージョンを使わざるを得ないので
    LLMでも音声合成でも最新のアプリケーションに対応しているのは良いと思う

typodupeerror

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

読み込み中...