LINEからも日本語言語モデルが来た!
みんな気になるLINEの会話データは学習に使ってない模様。使ってたら面白いのに
https://engineering.linecorp.com/ja/blog/3.6-billion-parameter-japanese-language-model
@ahinore 言及ありがとうございます。LINEのメッセージはクライアント間で暗号化されてますし、オープンチャットのデータは暗号化されてませんがLLM構築に使われることに嫌悪感を覚えるお客様がいらっしゃいますので、「気持ち悪いことはしない」の法則に従って利用しない選択をしています。結構性能良いので使えるかどうかお試しください。
@overlast 中の方ですか!
素晴らしい言語モデルを公開頂き大変ありがたいです。しかもApacheライセンスで使いやすい。
コンテキスト読んで適切なLINEスタンプ返してくるAIとか面白そうですが、さすがに会話データの活用は難しそうですね〜
LINEのオプションで会話データの提供とか選択できれば喜んで提供しますがw
@ahinore スタンプは学習に向かないようなw