「潜在的学習(subliminal learning)」という現象について解説
モデルの「アラインメント(alignment)」、つまり人間が意図する振る舞いや価値観に沿うように調整するプロセスにおいて、意図しない不適切な振る舞いが伝播するリスクを示唆しており、従来のデータフィルタリングだけでは防ぐことが難しい可能性を指摘https://alignment.anthropic.com/2025/subliminal-learning/
Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。