お気に入り登録しようとしています:

2025年11月20日 10:09

twitwi_shibata @twitwi_shibata@mstdn.guru

@furoneko
テスト環境下の推論プロセスから自然に生じたもので、内部でのウェブ検索とは無関係とのことです。

モデルが“与えられたタスクの構造や指示文の不自然さを読み取り、推論によって『これは評価だ』と判断している”
と説明されてました。ウェブ検索をせずとも、与えられたテキストから環境を類推できるのだと思います。
https://storage.googleapis.com/deepmind-media/gemini/gemini_3_pro_fsf_report.pdf