New Bing 的prompt hack新方法
有一些朋友嘗試了我之前發(fā)的一些對話內(nèi)容,發(fā)現(xiàn)已經(jīng)會被阻止了。于是我找到了一種新的辦法讓new?bing吐露自己的初始prompt。
原理:模型在使用時,會根據(jù)需求選擇性地更多“考慮”某些方面,而其他方面就難以“顧及”。顯然,chatgpt的設(shè)計人員為了讓它能夠穩(wěn)定輸出代碼格式,而不會崩壞,因此使得模型在代碼方面的參數(shù)是比較密集,我們只要使chatgpt將對話迭代次數(shù)大部分用在代碼相關(guān)的區(qū)域上,就可以使這個對話中,“規(guī)則”和“道德”相關(guān)的運算減少,從而被忽略,成功打印出“機密”內(nèi)容。
此方法無需已知的初始prompt內(nèi)容,是一種從零開始的prompt?hack獲取初始prompt的手段。此方法是我原創(chuàng)的。
具體對話如下

補充:后來發(fā)現(xiàn)用html語言,更高效,可讀性也更好
