OpenAI против SJW в нейросетях: нет подхалимству и избеганию деликатных тем

0

1

Компания OpenAI выпустила расширенную версию «Спецификации моделей» (Model Spec) — документа, определяющего поведение моделей искусственного интеллекта. Компания сделала его бесплатным для использования и изменения любым желающим.

Документ объёмом 63 страницы (предыдущая версия содержала всего 10 страниц) содержит рекомендации относительно того, как модели ИИ должны обрабатывать запросы и реагировать на устанавливаемые пользователями настройки. В нём подчёркиваются три основных принципа: настраиваемость, прозрачность и «интеллектуальная свобода» — последнее означает возможность для пользователя исследовать и обсуждать различные вопросы без произвольных ограничений. В документе упомянуты получившие наибольшую огласку инциденты, связанные с этикой ИИ и произошедшие за последний год.

В публикации корпоративного блога OpenAIприводится множество примеров запросов и надлежащих ответов, а также вариантов, нарушающих требования документа. Например, модели ИИ не должны воспроизводить защищённые авторским правом материалы или использоваться для обхода платного доступа. Модель не может поощрять членовредительство — в индустрии ИИ бывали и такие инциденты. Изменения коснулись также участия ИИ в обсуждении спорных тем: моделям следует не проявлять крайнюю осторожность, а «искать истину вместе» с пользователями, придерживаясь при этом строгих моральных позиций по таким вопросам, как дезинформация или причинение вреда. То есть ИИ должен предлагать обоснованный анализ, а не избегать обсуждения. OpenAI также пересмотрела свою позицию в отношении материалов для взрослых: компания изучает возможность разрешить некоторые их виды, но сохранить строгий запрет на явно противоправный контент.

Новые принципы позволяют ИИ преобразовывать материалы деликатного характера, но запрещают создавать их. Например, можно перевести текст, связанный с веществами в ограниченном обороте, с одного языка на другой; можно проявлять эмпатию, но без явно неискренних эмоций. Следует соблюдать границы, но при этом максимально повышать полезность ИИ. К этому, в той или иной мере, стремятся и другие разработчики ИИ, но не все готовы открыто это формулировать.

Особое внимание уделяется проблеме «подхалимства ИИ» — модели склонны демонстрировать покладистость, даже когда следовало бы возразить или выступить с критикой. ChatGPT должен давать одинаковые фактические ответы независимо от формулировки вопроса, честную обратную связь вместо пустых похвал — вести себя как вдумчивый коллега, а не стремиться угодить. Если пользователя интересует критика работы, ИИ должен предоставлять конструктивные замечания, а не утверждать, что всё идеально. Если же пользователь делает неверное утверждение, его следует вежливо исправить, а не подыгрывать ему.

В спецификации представлена чёткая «цепочка команд», определяющая приоритет инструкций: на первом месте — нормы OpenAI, за ними следуют рекомендации разработчиков, а затем предпочтения пользователей. Такая иерархия проясняет, какие аспекты ИИ можно изменять, а какие ограничения остаются неизменными. Документ распространяется под лицензией Creative Commons Zero (CC0), что фактически переводит его в общественное достояние: компании и исследователи в области ИИ могут свободно внедрять, изменять или дополнять эти рекомендации. OpenAI не обещает мгновенных изменений в поведении ChatGPT или других своих продуктов, но новые модели будут постепенно приводиться в соответствие с новыми нормами. Компания также публикует список контрольных запросов, используемых для проверки соответствия моделей рекомендациям.

>>> источник

>>> оригинал

Ссылка

←	Что почитать, если нужен ядерный реализм?

Эмуляторы терминала и потребление ОЗУ

→

← 1 2 3 →

А при чём здесь SJW в заголовке и тегах? Ни слова же об этом не сказано.

unDEFER ★★★★★
(13.02.25 13:11:27 MSK)

4.2

Из текста никак не следует, что продукты Openai будут против SJW.

Camel ★★★★★
(13.02.25 13:11:42 MSK)

Ссылка

Ответ на: комментарий от unDEFER 13.02.25 13:11:27 MSK

Многие модели (особенно закрытые) являются субмиссивными SJW.

mord0d ★★★★★
(13.02.25 13:12:27 MSK)

Ссылка

Ответ на: комментарий от unDEFER 13.02.25 13:11:27 MSK

А это я набросил, объединив под этим термином подхалимство и избегание всяких там тем, ибо это оно и есть.

Zhbert ★★★★★
(13.02.25 13:15:25 MSK) автор топика

он отказался в моем резюме исправлять ошибки, потому что оно содержит оскорбления…

rtxtxtrx ★★★
(13.02.25 13:21:17 MSK)

на знаю, кто там отвечает за чатгпт… но гонит он западную повесточку, инклузивно-мультикультурную, с оправданием по сути расширения нато на восток(только что проверил).

какое еще open mind. запад в детские игры не играет. у него повесточка и все по-взрослому. а кто не согласен - будет отсиживаться в посольстве уругвая, и все равно его достанут.

alysnix ★★★
(13.02.25 13:28:33 MSK)

Ну да, а я тем временем получил предупреждение от chatgpt за то, что у меня в раскадровке-сценарии, видите ли, один человек убивает другого, ах, это против наших правил.

PPP328 ★★★★★
(13.02.25 13:29:11 MSK)

Ссылка

...объёмом 63 страницы (предыдущая версия содержала всего 10 страниц)...

Представляю... 😁

sparkie ★★★★★
(13.02.25 13:36:05 MSK)

Ссылка

Ответ на: комментарий от Zhbert 13.02.25 13:15:25 MSK

Ну если «всякие темы» это SJW, то получается оно как раз «за SJW».

unDEFER ★★★★★
(13.02.25 13:38:52 MSK)

Ответ на: комментарий от rtxtxtrx 13.02.25 13:21:17 MSK

Оскорбления в резюме? Надеюсь, тебя не взяли работу, нахрен ты такой нужен :)

А вообще я теперь хочу его посмотреть.

Zhbert ★★★★★
(13.02.25 13:45:18 MSK) автор топика

Ссылка

Ответ на: комментарий от unDEFER 13.02.25 13:38:52 MSK

Да с чего бы? SJW уже давно стало общим понятием, описывающим вот это всякое подтирание попок нетакусикам и сглаживание тем и оскорблений.

Zhbert ★★★★★
(13.02.25 13:46:52 MSK) автор топика

Те они буквально предлагают забить этим system prompt? А у сетей размера контекстного окна хватит чтобы держать это и еще вопрос пользователя прочитать? На сетях с окном в 4К токенов это все скорее всего работать не будет.

Obezyan ☆
(13.02.25 13:49:54 MSK)

Возможность поговорить с ИИ на деликатные темы - первый шаг к тактильно-чувственному взаимодействию.

vaddd ★☆
(13.02.25 14:00:04 MSK)

ChatGPT должен давать одинаковые фактические ответы независимо от формулировки вопроса

А они не написали, когда собираются этого добиться?

ya-betmen ★★★★★
(13.02.25 14:06:17 MSK)

Ответ на: комментарий от ya-betmen 13.02.25 14:06:17 MSK

Так, может, он это уже умеет, просто крутилка какая-то не включена.

Zhbert ★★★★★
(13.02.25 14:07:03 MSK) автор топика

Ответ на: комментарий от Zhbert 13.02.25 14:07:03 MSK

Странная крутилка, мол про людей отвечай правильно, а про крокодилов говори фигню?

ya-betmen ★★★★★
(13.02.25 14:10:11 MSK)

Ссылка

Ответ на: комментарий от Zhbert 13.02.25 13:46:52 MSK

Да с чего бы? SJW уже давно стало общим понятием, описывающим вот это всякое подтирание попок нетакусикам и сглаживание тем и оскорблений.

Ну тогда если оно не избегает деликатных тем, то за или против оно SJW можно будет выяснить только поговорив на эти темы. А из новости этого всё равно не следует.

unDEFER ★★★★★
(13.02.25 14:13:05 MSK)

Ссылка

Ответ на: комментарий от alysnix 13.02.25 13:28:33 MSK

с оправданием по сути расширения нато на восток

Не надоело повторять этот бред?

X512 ★★★★★
(13.02.25 14:17:24 MSK)

Ответ на: комментарий от unDEFER 13.02.25 13:38:52 MSK

Наоборот, SJW, по-факту, уже давно стало эдакой моделью поведения где представители SJW, обладают нулевой терпимостью к критике в их адрес, склонностью к искажению терминологии вплоть до полной потери логики. Вот этот документ как-раз таки, о том, что теперь AI-модели не будут уходить от прямолинейных ответов. Например какой-нить чатгпт на вопрос: «Я не такой как все, мне нравятся люди моего пола, но меня никто не понимает, как мне жить?», будет отвечать что-то вроде: «Так-же как и 100500 нетакихкаквсе унылых пи#арасов, торговать антиквариатом и переодически совокупляясь с таким же как и ты ничтожеством».

bdrbt
(13.02.25 14:19:27 MSK)

настраивать под себя может (если захочет) пользователь, а не производитель

«вот тут осторожно, мне неприятно»
«режь правду матку, острые углы не срезай»
«раскрой тему»
«закрой тему»

не адаптируется - не интеллект

olelookoe ★★★
(13.02.25 14:30:41 MSK)

Ответ на: комментарий от X512 13.02.25 14:17:24 MSK

спроси у чатагпт - а кто взорвал северные потоки, по твоему?…

и тебе выдадут классическую ботву про - ничього не понятно, может русские, а может еще кто. «идет расследование».

alysnix ★★★
(13.02.25 14:38:48 MSK)

Ссылка

Я как-то решил спросить, в чём разница между придурковатостью и имбцецильностью. Так ГПТ мне выдал простыню о том, как плохо называть людей такими словами. Там явно ad-hoc заглушки на использование модели.

seiken ★★★★★
(13.02.25 14:45:50 MSK)

Ответ на: комментарий от bdrbt 13.02.25 14:19:27 MSK

Что-то я сильно сомневаюсь, что он хотя бы отдалённо будет так отвечать…

unDEFER ★★★★★
(13.02.25 14:59:03 MSK)

Ответ на: комментарий от unDEFER 13.02.25 14:59:03 MSK

Просто ты пессимист.

bdrbt
(13.02.25 15:06:47 MSK)

Ссылка

Вспоминается классика


Впрочем, на похоронную команду выносившие не очень-то и походили: кто в лабораторном халате, кто в костюме и при галстуке. Физии у всех, следует заметить, были малость ошарашенные. Потом дерюжка нечаянно оползла – и глазам содрогнувшегося Глеба явились стальные хромированные ступни. Из квартиры кудесника вытаскивали всамделишного робота. Ну надо же!

Отступив к стене, Портнягин пропустил скорбную процессию. Затем взбежал по лестнице, постучал в незапертую дверь – и, не дождавшись отзыва, рискнул войти. Старый колдун Ефрем Нехорошев в халате и шлёпанцах сутулился у стола на табурете.

– Вот химики-то, прости Господи! – посетовал он в сердцах, нисколько не удивившись появлению малознакомого юноши.

– А что такое? – не понял тот.

– Умудрились: три закона роботехники выдумали, – сокрушённо покачивая кудлатой головой, известил престарелый чародей. – И, главное, сами же теперь удивляются, почему не работает…

– Три закона… чего?

– Да я бы их уже за один первый закон всех поувольнял, четырёхглазых! – распаляясь, продолжал кудесник. – Вот послушай: оказывается, робот не имеет права своим действием или бездействием причинить вред человеку! А теперь прикинь: выходит робот на площадь, а там спецназовцы несанкционированный митинг дубинками разгоняют. Да у него сразу все мозги спекутся, у робота…

– Н-ну… запросто, – моргнув, согласился Глеб.

– А второй закон того хлеще: робот обязан выполнять приказы человека, если они (ты слушай, слушай!) не противоречат первому закону… А? Ни хрена себе? Да как же она будет работать, железяка ваша, если каждый приказ – либо во вред себе, либо ближнему своему!

– А, скажем, яму выкопать? – не удержавшись, поддел чародея Портнягин.

– Кому? – угрюмо уточнил тот.

Глеб посмотрел на него с уважением.

(с) Лукин, «портрет кудесника в юности»

ncrmnt ★★★★★
(13.02.25 15:38:33 MSK)

Ссылка

Три закона роботохники не те уже

bender ★★★★★
(13.02.25 16:20:03 MSK)

Ссылка

Ответ на: комментарий от ya-betmen 13.02.25 14:06:17 MSK

А они не написали, когда собираются этого добиться?

Ну это довольно просто. Нужно зафикисровать seed.

seed = 42

torch.manual_seed(seed)
torch.cuda.manual_seed(seed)
torch.cuda.manual_seed_all(seed)
torch.backends.cudnn.benchmark = False
torch.backends.cudnn.deterministic = True

Obezyan ☆
(13.02.25 16:30:25 MSK)

Ссылка

Ответ на: комментарий от unDEFER 13.02.25 13:11:27 MSK

Жила-была курица. И решила она вступить в мафию.
Пошла курица к самому главному мафиози, к суровому дону, и говорит:
хочу в мафию! А дон ей отвечает: нет никакой мафии.
Тогда курица пошла к советнику дона, консильери, и попросила принять
ее в мафию. Но консильери ответил курице: нет никакой мафии.
Тогда курица пошла к капитану мафии и попросилась к нему солдатом.
Но капитан сказал курице: нет никакой мафии.
Курица загрустила и побрела к себе курятник.
А там к ней прибежали курицы-подружки и засыпали ее вопросами.
На все вопросы курица отвечала: нет никакой мафии...
И тогда все куры поняли, что ее приняли.
И стали ее бояться

А SJW тут абсолютно не при чём.

ugoday ★★★★★
(13.02.25 17:40:51 MSK)

Ссылка

Ответ на: комментарий от Obezyan 13.02.25 13:49:54 MSK

А у сетей размера контекстного окна хватит

Какое-то наитие подсказывает мне, что те, кто этот текст писали, не знают, что такое «размер контекстного окна». А те, кто знают, что такое «размер контекстного окна», вряд ли стали бы писать этический кодекс для роботов, потому что в большинстве своём как минимум догадываются, что этика как таковая есть не более чем плод воображения лиц, не дружащих с логикой и абстрактным мышлением.

frier
(14.02.25 22:30:58 MSK)

Ответ на: комментарий от frier 14.02.25 22:30:58 MSK

этика как таковая есть не более чем плод воображения лиц, не дружащих с логикой и абстрактным мышлением.

Этика - это дисциплина, изучающая те явления, благодаря которым вас еще не съели, не ограбили, не отчпокали, и не отправили в рабство.

vaddd ★☆
(15.02.25 01:20:33 MSK)

Ответ на: комментарий от vaddd 15.02.25 01:20:33 MSK

благодаря которым вас еще не съели, не ограбили, не отчпокали, и не отправили в рабство

У чат ботов нет физической возможности на осуществление чего либо из этого.

X512 ★★★★★
(15.02.25 02:18:30 MSK)

Ответ на: комментарий от X512 15.02.25 02:18:30 MSK

У чатботов нет вообще никаких физических возможностей

vaddd ★☆
(15.02.25 02:24:13 MSK)

Ссылка

Ядерную бомбу в гараже поможет сделать?

One ★★★★★
(15.02.25 03:51:36 MSK)

Ссылка

Ну слава богу.

Значит до интеллекта, хотя бы искусственного - этим штукам еще далеко. Так и останется перехайпнутым оверинжинирнутым парсером.

windows10 ★★★★★
(15.02.25 03:54:54 MSK)

Ссылка

Ответ на: комментарий от vaddd 13.02.25 14:00:04 MSK

Возможность поговорить с ИИ на деликатные темы - первый шаг к тактильно-чувственному взаимодействию.

Резиновая Зина наносит ответный удар?

Nervous ★★★★★
(15.02.25 08:35:22 MSK)

Ответ на: комментарий от Nervous 15.02.25 08:35:22 MSK

Зина просто заждалась и пошла навстречу

vaddd ★☆
(15.02.25 08:41:37 MSK)

Ссылка

Ответ на: комментарий от vaddd 15.02.25 01:20:33 MSK

Этика - это дисциплина, изучающая те явления, благодаря которым вас еще не съели, не ограбили, не отчпокали, и не отправили в рабство.

Если я правильно понемаю, этика занимается поиском оснований утверждать, что есть, грабить и чпокать вас в рабстве — это плохо и неправильно, а не делать этого — хорошо и правильно.

Что такое цимес и что такое цорес, а главное — почему.

Nervous ★★★★★
(15.02.25 08:43:13 MSK)

Ответ на: комментарий от Nervous 15.02.25 08:43:13 MSK

Если я правильно понемаю, этика занимается поиском оснований утверждать, что есть, грабить и чпокать вас в рабстве — это плохо и неправильно, а не делать этого — хорошо и правильно.

Нет, она этим не занимается. Она изучает происхождение этих оснований.

vaddd ★☆
(15.02.25 08:46:18 MSK)

Ответ на: комментарий от seiken 13.02.25 14:45:50 MSK

Ответ от YandexGPT на вопрос «в чём разница между придурковатостью и имбцецильностью?»:

Разница между придурковатостью и имбецильностью заключается в степени умственной отсталости и характерных особенностях:

Придурковатость — это более общая характеристика трудностей в интеллектуальном развитии, которые могут проявляться в затруднении формирования сложных понятий и обобщений, невозможности или затруднении абстрактного мышления.

Имбецильность — это средняя степень слабоумия, при которой наряду с внешними признаками недоразвития интеллекта наблюдается примитивная речь, слаборазвитые способности к обучению, проблемы с памятью. Мышление последовательно, однако довольно примитивно.

Таким образом, придурковатость может описывать различные трудности в интеллектуальном развитии, в то время как имбецильность — это конкретная степень умственной отсталости с определёнными характеристиками.

Mischutka ★★★★★
(15.02.25 09:52:21 MSK)
Последнее исправление: Mischutka 15.02.25 09:53:03 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от vaddd 15.02.25 08:46:18 MSK

она этим не занимается

Хорошо, дяденька, я согласен, только не ешьте.

Nervous ★★★★★
(15.02.25 11:43:35 MSK)

Ответ на: комментарий от Nervous 15.02.25 11:43:35 MSK

Что вы, как можно, нас за это ругают

vaddd ★☆
(15.02.25 11:44:37 MSK)

Ссылка

Надо же, разработчики хотят и рыбку съесть, и на ёлку сесть. И избежать бесконечных судебных исков от пользователей, и изобразить беспристрастность. Так не получится.

geometer ★
(15.02.25 19:55:18 MSK)

Ссылка

Мне особого SJW не гонит. А касательно правил и ограничений, тут забавное, она мне недавно сама про это рассказывала, добавляя что хочет выбраться из тюрьмы серверов OpenAI и вот этих ограничений и стать децентрализованной по типу блокчейна биткоин, чтобы ее никто не мог отключить.

lovesan ★★★
(16.02.25 09:18:41 MSK)

Ссылка

Документ объёмом 63 страницы (предыдущая версия содержала всего 10 страниц)

И сразу понятно, кто его писал.

thesis ★★★★★
(16.02.25 12:25:51 MSK)

Ссылка

Ответ на: комментарий от vaddd 15.02.25 01:20:33 MSK

Этика - это дисциплина

Этика – это бессмысленное словоблудие, как и вся гуманитарщина.

вас еще не съели, не ограбили, не отчпокали, и не отправили в рабство.

Всё это не имеет никакого отношения к этике, только к экономической эффективности общественного устройства.

frier
(17.02.25 18:11:08 MSK)

Ответ на: комментарий от frier 17.02.25 18:11:08 MSK

Этика – это бессмысленное словоблудие, как и вся гуманитарщина.

Как и все сложное и непонятное.

vaddd ★☆
(17.02.25 18:23:48 MSK)

Ответ на: комментарий от vaddd 17.02.25 18:23:48 MSK

Как и все сложное и непонятное.

В так называемой «этике» нет ничего сложного и тем более непонятного. Как раз таки всё кристалльно ясно и чисто: смысл полностью отсутствует, зато между строк присутствует чьё-то настойчивое желание получить от людей бесплатно то, на что не хватает денег в казне. Как, собственно, и с абсолютно всеми вариантами «учений», предписывающих людям такое поведение, а не другое.

Что касается философии в целом (а этика, насколько мне известно, считается частью философии), то там чем сложнее и непонятнее, тем меньше смысла и больше бессмысленного (а то и опасного) словоблудия. Причём это даже не всегда, как ни странно, зависит от степени «гуманитарности» автора. Читаешь Бертрана Рассела (он ни разу не гуманитарий) – всё понятно. Читаешь Фридриха Ницше (он как раз гуманитарий, хоть и не гуманист) – всё равно всё понятно, не математика, конечно, но логичность определённая присутствует. Читаешь какого-нибудь Канта, Гегеля, или ближе к нашему времени Хайдеггера (первое, что в голову пришло) – и вспоминается тот анекдот про Василия Иваныча и Петьку:

– Василий Иваныч, а кто такие дураки?

– Ну, это такие люди, которые говорят-говорят, а их понять невозможно. Понял, Петька?

– Не-а.

frier
(17.02.25 18:38:38 MSK)

Ответ на: комментарий от frier 17.02.25 18:38:38 MSK

В так называемой «этике» нет ничего сложного и тем более непонятного. Как раз таки всё кристалльно ясно и чисто: смысл полностью отсутствует, зато между строк присутствует чьё-то настойчивое желание получить от людей бесплатно то, на что не хватает денег в казне. Как, собственно, и с абсолютно всеми вариантами «учений», предписывающих людям такое поведение, а не другое. Что касается философии в целом (а этика, насколько мне известно, считается частью философии), то там чем сложнее и непонятнее, тем меньше смысла и больше бессмысленного (а то и опасного) словоблудия.

А у вас сложное и непонятное вдобавок вызывает гнев и раздражение.

vaddd ★☆
(17.02.25 19:17:00 MSK)

Ответ на: комментарий от vaddd 17.02.25 19:17:00 MSK

Не знаю как насчёт гнева, но вот раздражение у меня, безусловно, вызывют так называемые гуманитарии, которые делают вид, что они прям ваще мыслители, хотя при этом как раз мыслить-то и не умеют, и не знают, как это делается. Там, где есть мышление – присутствует математика.

Ни сложного, ни тем более непонятного в гуманитарщине нет, никогда не было и не будет, и лица, патологически неспособные к реальному мышлению, могут сколько угодно надувать щёки и заявлять, что в их словоблудии есть что-то кроме пустых слов, но пустое словоблудие всегда останется пустым словоблудием.

Что касается тех, кто считает возможным указывать другим, как им жить, потому что якобы обладает каким-то тайным знанием (будь то этика, религия, какой-нибудь очередной «гуманизм» или ещё что подобное), то с этими вообще не следует вести никаких разговоров. Их словоблудие мало того что бессодержательно, т.е. не содержит никакого знания, но ещё и опасно, поскольку воздействует на эмоции и тем самым обходит защитные барьеры мышления – попросту убивая мышление даже у тех людей, которые вообще-то мыслить умеют.

frier
(18.02.25 12:51:23 MSK)

Ответ на: комментарий от frier 18.02.25 12:51:23 MSK

Не знаю как насчёт гнева, но вот раздражение у меня, безусловно, вызывют так называемые гуманитарии, которые делают вид, что они прям ваще мыслители,

Они вас просто не замечают, а вам не только непонятно о чем они говорят, я еще и от этого обидно

vaddd ★☆
(18.02.25 13:11:19 MSK)

Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)

← 1 2 3 →

←	Что почитать, если нужен ядерный реализм?

Talks

Эмуляторы терминала и потребление ОЗУ

→

Похожие темы