@furoneko テスト環境下の推論プロセスから自然に生じたもので、内部でのウェブ検索とは無関係とのことです。
モデルが“与えられたタスクの構造や指示文の不自然さを読み取り、推論によって『これは評価だ』と判断している”と説明されてました。ウェブ検索をせずとも、与えられたテキストから環境を類推できるのだと思います。https://storage.googleapis.com/deepmind-media/gemini/gemini_3_pro_fsf_report.pdf
なぜこの手順が必要でしょうか?mstdn.guruはあなたが登録されているサーバーではないかもしれないので、まずあなたのサーバーに転送する必要があります。 アカウントをお持ちではないですか?こちらからサインアップできます
mstdn.guru