簡潔にまとめられていますね。
DeepSeek-R1 の概要
https://note.com/npaka/n/n6a5d43bf451c
この辺は子育てと同じような人間臭さを感じます。RT
DeekSeek R1に天安門事件について聞くやつ。ollamaでローカルでやっても回答を拒否しますね。Thinkの内容を見ると事象そのものの知識はあるが回答を拒否するよう学習されているのがわかる。サービス側での検閲もしてるでしょうが、配布学習モデル自体も中国の意思に沿ったチューニングがされている。
https://x.com/mobilehackerz/status/1881873812989600199?s=61
RT
DeepSeekさんの偉業、今までOpenAI / Anthropic / Google三強だったところに全世界の有象無象研究チームやスタートアップが参入する余地が一気に敷かれた感があり、手法自体も強化学習ベースでここまでいくというのが斬新だし、技術革新がさらに加速しそう
https://x.com/izutorishima/status/1881552322775707945?s=61