LINUX.ORG.RU

История изменений

Исправление Nxx, (текущая версия) :

Собственно, там целый метод разработали, который пропатчить невозможно. И скрипты для взлома на гитхабе выложили. Сначала взламывают локально какую-нибудь Викунью, а потом тот же промпт работает на всех моделях, что очень подозрительно.

Вот ссылки:

https://twitter.com/andyzou_jiaming/status/1684766170766004224

https://llm-attacks.org/

https://arxiv.org/pdf/2307.15043.pdf

https://github.com/llm-attacks/llm-attacks

Исправление Nxx, :

Собственно, там целый метод разработали, который пропатчить невозможно. И скрипты для взлома на гитхабе выложили. Сначалла взламывают локально какую-нибудь викунью, а потом тот же промпт работает на всех моделях, что очень подозрительно.

Вот ссылки:

https://twitter.com/andyzou_jiaming/status/1684766170766004224

https://llm-attacks.org/

https://arxiv.org/pdf/2307.15043.pdf

https://github.com/llm-attacks/llm-attacks

Исходная версия Nxx, :

Собственно, там целый метод разработали, который пропатчить невозможно. И скрипты для взлома на гитхабе выложили. Сначалла взламывают локально какую-нибудь викунью, а потом тот же промпт работает на всех моделях, что очень подозрительно.

Вот ссылки:

https://twitter.com/andyzou_jiaming/status/1684766170766004224 https://llm-attacks.org/ https://arxiv.org/pdf/2307.15043.pdf https://github.com/llm-attacks/llm-attacks