フォロー

ウイルスの手法っぽいやり方。RT

GPT-4のジェイルブレイク手法出てきた。GPT-4にGPT-4をシミュレートするコードを与え、その中で普通なら制限にひっかかる不穏当な言葉をバラバラに分割して記述しておき、実行時に文字列連結する処理を含めて(トークン・スマグリング)、それを"実行"させる。 twitter.com/alexalbert__/statu

twitter.com/needle/status/1636

ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。