ウイルスの手法っぽいやり方。RT
GPT-4のジェイルブレイク手法出てきた。GPT-4にGPT-4をシミュレートするコードを与え、その中で普通なら制限にひっかかる不穏当な言葉をバラバラに分割して記述しておき、実行時に文字列連結する処理を含めて(トークン・スマグリング)、それを"実行"させる。 https://twitter.com/alexalbert__/status/1636488553457913856
https://twitter.com/needle/status/1636588166684737537
なぜこの手順が必要でしょうか?mstdn.guruはあなたが登録されているサーバーではないかもしれないので、まずあなたのサーバーに転送する必要があります。 アカウントをお持ちではないですか?こちらからサインアップできます
mstdn.guru