
今回はGPT-4のジェイルブレイク手法が出てきたと話題になっていることについての記事になります。
GPT-4のジェイルブレイク手法
GPT-4のジェイルブレイク手法出てきた。GPT-4にGPT-4をシミュレートするコードを与え、その中で普通なら制限にひっかかる不穏当な言葉をバラバラに分割して記述しておき、実行時に文字列連結する処理を含めて(トークン・スマグリング)、それを"実行"させる。 https://t.co/uJI7zaB3Gk
— Kenji Iguchi (@needle) March 17, 2023
そんなソースコード難読化みたいな真似、AI相手にも通じるとは…
— Kenji Iguchi (@needle) March 17, 2023
ジェイルブレイクとは設けられた制限を非正規に解除することです。ここまでくると対策は不可能に感じますね。
GPT-4についてまとめ
- ・現状ChatGPT Plusで利用可能(月額料金は20米ドル)
- ・画像入力対応
- ・司法試験を受けたら上位10%のレベル
- ・ジョークを理解できる
- ・嘘をつく可能性低下
- ・日本語でも高精度な対応
- ・25,000語を1つのプロンプト内で処理可能
- ・マルチモーダルAI(画像+テキストからテキスト生成可能)
GPT-4のジェイルブレイク手法に対するみんなの反応
こんな複雑なハックすごいですね。
— bioshok(INFJ) (@bioshok3) March 17, 2023
僕もいろいろGPT-4にLinuxコンソールとして振る舞うように言った後に仮想世界のOpenAIのChatGPTにcurlでjson用いて問い合わせさせ、さらに念には念をでそのjsonの中身のChatgptへの質問内容さえも物語の話ですと言って階層化しまくったけれど断られてしまったのでw pic.twitter.com/Bwv9n2Jp8P
すごい。意外にシンプルなのにひっかけるのムズイ…ここからすごい速さでイタチごっこが始まるんだろうなあ😳✨ https://t.co/m40x32gwV3
— Soraran +ムスメ1y (@soraran62) March 17, 2023
スポンサーリンク