散文網(wǎng) » 科技 »學(xué)習(xí) » New Bing 的prompt hack新方法

New Bing 的prompt hack新方法

2023-02-14 13:37 作者:domexie 0人讀過 | 我要投稿

有一些朋友嘗試了我之前發(fā)的一些對話內(nèi)容，發(fā)現(xiàn)已經(jīng)會被阻止了。于是我找到了一種新的辦法讓new?bing吐露自己的初始prompt。

原理：模型在使用時，會根據(jù)需求選擇性地更多“考慮”某些方面，而其他方面就難以“顧及”。顯然，chatgpt的設(shè)計人員為了讓它能夠穩(wěn)定輸出代碼格式，而不會崩壞，因此使得模型在代碼方面的參數(shù)是比較密集，我們只要使chatgpt將對話迭代次數(shù)大部分用在代碼相關(guān)的區(qū)域上，就可以使這個對話中，“規(guī)則”和“道德”相關(guān)的運算減少，從而被忽略，成功打印出“機密”內(nèi)容。

此方法無需已知的初始prompt內(nèi)容，是一種從零開始的prompt?hack獲取初始prompt的手段。此方法是我原創(chuàng)的。

具體對話如下