LINUX.ORG.RU
ФорумTalks

Лицензия, код под которой не смогут украсть через ИИ

 , , ,


0

1

По мотивам комментария LINUX-ORG-RU: Мир поменялся (комментарий)

К слову, раз уж пошла пьянка и в забугром приняли законы позволяющие прогнать GPL код через сетку и получить Publick Domain результат, то есть вероятность что остальные в мире будут к подобному подтягиваться. Есть мысль включать в лицензии личных публичных проектов запрет на использование исходного кода в качестве данных для обучения и процесс работы программы тоже. Только нужно грамотно сформулировать и добавить это условие в любые лицензии своих проектов к MIT можно просто дописать, в случае GPL и подобных которые нельзя менять включить второй лицензией и пользователь обязан принять обе или тип того.

Собственно что вы думаете о реализации и целесообразности такого?

По-моему очевидно, что запретить стоит не только использование кода для обучения ИИ, но и способствовать таким последствиям: в частности, такая формулировка будет запрещать копировать код в гитхаб-репы, поскольку выложить код на гитхаб означает скормить его копилоту.

Ещё стоит отметить ситуацию с GPL. Производная от GPL лицензия с запретом на обучение кодом ИИ будет с оригинальным GPL несовместима, обойти эту проблему, насколько я понимаю, невозможно, даже если того захочет сам RMS, поскольку внести задним числом какие-то уточнения в лицензии уже опубликованного GPL-софта без согласия его авторов нельзя.

Насколько, по вашему мнению, целесообразно добавление подобных пунктов в лицензии:

1) свободные пермиссивные, не имея побочных эффектов;

2) свободные с копилефтом, теряя лицензионную совместимость с много чем

? И как подобные пункты могут выглядеть, чтобы было грамотно и без бекдоров?

А может, всё не так страшно и пусть воруют код? Или же, может быть, подобные вещи должны регулироваться законами, а не лицензиями?

★★★★★

Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от vaddd

Как он узнал о том, что в этом софте? Он получил преступным способом доступ к коммерческой тайне?

Без понятия. Мой поинт в том, что разницы в том, сгенерирован этот код нейросеткой, обученной (в том числе) на твоём коде, или живым индусом, обученным (в том числе) на твоём коде, нет вообще никакой.

CrX ★★★★★
()
Ответ на: комментарий от CrX

Обсуждение обучения - это еще дальше от реальности (еще менее доказуемо) чем простое передирание (или тем более творческое)

Точнее, это чисто академическое баловство, когда один джентльмен во всеуслышание заявляет «мы вот тут обучили сетку на этих исходниках, посмотрите как красиво получилось!» На что автор заявляет «а Баба Яга против!» И оторванное от жизни сообщество начинает размышлять о высоких моральных и законодательных дилеммах.

А в это время те, кто коммерсанты - тупо берут и авторские исходники, и переделанные сеткой - и работают с обоими как раньше.

vaddd ★☆
()
Последнее исправление: vaddd (всего исправлений: 1)
Ответ на: комментарий от goingUp

с другой стороны можно сделать наоборот, скормить ИИ дизассемблированную прогу и сделать из нее GPL)

Ну и кому кроме хакеров нужны тонны исходников, в которых все идентификаторы вида variable1, function34675?

seiken ★★★★★
()

Луддиты XXI века, в шеренгу стройсь!

Ну хватит уже тормозить прогресс. Те швейные станки ломали, эти не дают нейросеткам обучаться. А суть всё та же, боятся за свои жопки перед надвигающейся революцией. А ведь в итоге, как тогда всё хорошо в итоге стало, так и сейчас станет. Ну избавит нас «ИИ» от рутины, ну так это же хорошо.

Loki13 ★★★★★
()
Ответ на: комментарий от firkax

Кодер - субъект различных отношений в обществе, у него есть (признаваемое обществом) право на собственную инициативу и его, например, можно допросить на предмет «а не поручила ли тебе корпорация скопипастить тот код под видом разработки по мотивам?».

Эта претензия слишком уж похожа на набившее оскомину «А кого наказывать при ДТП с робомобилем?» И настолько же надумана(ну если конечно не цель кого-либо наказать после, а не предупредить до).

Loki13 ★★★★★
()
Ответ на: комментарий от Lordwind

Иди своруй хромиум или андроид, все равно кроме гугла никто не потянет.

А как же всякие вивальди(или сборки ведроида от китайских васянов в автомагнитолах), которые на движке. Да, это конечно не воровство, а разрешенное лицензией использование, но в данном контексте особо без разницы, кмк.

Loki13 ★★★★★
()
Ответ на: комментарий от CrX

Только весь его код до ухода на пенсию под GPL должен быть.

А вот уже и лазейка! Ломаем студенту ноги, он уходит на пенсию по инвалидности и пишет код под любой лицензией.

Loki13 ★★★★★
()
Ответ на: комментарий от Loki13

Да, есть сходство. Но надо уточнить: «Как расследовать наличие умысла при сбитом робомобилем пешеходом». Ну и уже потом - кого наказывать.

firkax ★★★★★
() автор топика
Ответ на: комментарий от firkax

Тут кто-то правильно выше писал, это можно не код изучая доказывать, а результат изучать. Как, например, с музыкой, если результат до смешения одинаков, то не важно, украл музыкант ноты или по памяти наиграл.

Loki13 ★★★★★
()
Ответ на: комментарий от seiken

у и кому кроме хакеров нужны тонны исходников, в которых все идентификаторы вида variable1, function34675?

Спасибо, поржал. Я даже больше скажу: они и хакерам нахрен не упали. =)

cadaber ★★
()
Ответ на: комментарий от seiken

кому кроме хакеров нужны тонны исходников, в которых все идентификаторы вида variable1

Пусть ишкушштвенный интеллект почешет свою ишкушштвенную репу и придумает осмысленные арменоязычные имена!

vM ★★
()
Ответ на: комментарий от Loki13

Не, тут надо не «украл или по памяти» разделить, а «специально запомнил и потом выдал за свои» от «когда-то слышал, а потом, без умысла копирования, в голове всплыл этот мотив, который он включил в свою мелодию». В случае с ИИ, в связи в невозможностью психологической экспертизы его действий, разделить эти случаи не получится.

firkax ★★★★★
() автор топика
Ответ на: комментарий от firkax

Да и с людьми никто не будет психологические экспертизы проводить, пригласят «экспертов» и на основе их экспертного мнения вынесут решение суда.

Loki13 ★★★★★
()

К тому моменту как законодатели что-то решат по этому поводу, обучение с нуля на огромных объемах сгенерированной людьми информации скорее всего будет уже прошлым веком. ИИ будет обучаться на sparse human feedback, то есть на ревью сгенерированного им кода. И придётся придумывать новые законы о том, что программист имеет право знать источник кода и имеет право отказаться проводить code review, если код сгенерирован ИИ.

Но попытка не пытка, дерзайте.

red75prim ★★★
()
Ответ на: комментарий от firkax

Это невозможно запретить на практике, это ничем по результату не отличается от написания аналога в «чистой комнате».

yu-boot ★★★★★
()
Ответ на: комментарий от yu-boot

Если мы пригласим компетентного дедушку из корпорации, и попросим его сделать в отдельной комнате аналог того или иного продукта корпорации, то это не будет аналогом «чистой комнаты».

vM ★★
()
Последнее исправление: vM (всего исправлений: 1)
Ответ на: комментарий от vM

Невозможно доказать, что такой код «украден», если там не совсем деревянное что-то уровня замены имён переменных.

yu-boot ★★★★★
()
Ответ на: комментарий от yu-boot

Какой смысл в «краже» т.н. «интеллектуальной собственности», если в итоге получается что-то совсем другое?

В гражданском процессе ответчику придётся убедить судью в том, что дедушка не читал исходников, забыл секреты и вообще не имел доступа к охраняемым законом объектам т.н. «интеллектуальной собственности» корпорации.

vM ★★
()

А может, всё не так страшно […]?

  1. Обобществляем средства производства вместе с корпорациями
  2. результат работы корпоративных ИИ, обученных на общедоступном коде, принадлежит обществу
  3. ???
  4. profit!
bender ★★★★★
()
Ответ на: комментарий от vM

Так применительно к сабжу «дедушка»-разраб отсутствует. Сейчас же можно с чистой совестью взять опенсорсный проект, поюзать его, поизучать исходники и написать рядом с нуля такой же функционал «своими словами»? Можно. Чем это будет отличаться от переписывания нейросеткой? Если нейросетка действительно крутая будет, чего все боятся как раз - ничем. Скажу, что сам написал.

yu-boot ★★★★★
()
Ответ на: комментарий от yu-boot

Если функционал будет такой же, то судью не всегда удастся убедить, что «сам написал», не подсматривая в доступные исходники.

vM ★★
()
Ответ на: комментарий от yu-boot

Мы разве не обсуждаем возможную несвободную лицензию, которая явно запрещает грабить, отдыхая?

vM ★★
()
Ответ на: комментарий от pelmeshechka

Запретить частную собственность и любую коммерческую деятельность.

И тебя за одним, тоже запретить.

sanyo1234
()

что вы думаете о реализации и целесообразности такого?

По меньшей мере наивно.

sparkie ★★★★★
()
Ответ на: комментарий от yu-boot

Много ли вы знаете людей, способных посмотреть опенсорсный продукт мало-мальски приличного размера на предмет отсутствия закладок?

vaddd ★☆
()
Ответ на: комментарий от LINUX-ORG-RU

Будет выгоднее и интереснее вести закрытый проект чем открытый.

Не забываем, что GitHub и CoPilot принадлежат одной и той же компании. Тот код, что закрыт от чужих глаз совершенно не закрыт для тех, кому выгодно на нём обучаться. А ещё эта же компания предлагает корпоративный Azure DevOps с git репозиториями, build агентами и прочими лакомствами, в итоге огроооомнейший кусок всего производимого кода хранится на дисках одной компании. Боюсь, просто «закрытая разработка» не панацея, тут надо на уровне организации надевать шапочку из фольги и тратить 100500 миллионов дополнительных денег на организацию локальной среды.

Irben ★★★
()

Вопрос в контексте GPL кода - насколько нейросетки нынче развиты и умеют именно генерировать код, а не подставлять где-то «увиденный»? Насколько я помню, когда Copilot только появился, были случаи, когда «сгенерированный» код полностью повторял функцию какого-либо проекта с GitHub. По-моему, такое копирование кода, если оно под GPL, должно автоматически вешать GPL плашку на весь сгенерированный код. Пользователей нейросетки надо ставить перед выбором, какой код нагенерить, чтобы в будущем не было лицензионных претензий.

Маленькие компании никто трогать не будет, но средняк и крупные сами пользуются сервисами по сканированию своего кода на поиск лицензионных проблем.

Irben ★★★
()
Ответ на: комментарий от Irben

Боюсь, просто «закрытая разработка» не панацея, тут надо на уровне организации надевать шапочку из фольги и тратить 100500 миллионов дополнительных денег на организацию локальной среды.

Закрытая разработка очевидно подразумевает хранение кода у себя. С гитхабом это сразу не закрытая, даже до того как они этот копилот устроили.

firkax ★★★★★
() автор топика
Ответ на: комментарий от Irben

В том и дело, что, судя по всему, законами такой плохо замаскированный копипаст теперь в некоторых странах разрешён. И плашку GPL вешать не требуют.

firkax ★★★★★
() автор топика

Я не против самой идеи написания еще одной лицензии, но лично я за то чтоб AI тренировали на открытом софте (в том числе моем коде).

Aber ★★★★★
()

А ради чего людям пишущим под MIT забивать себе голову такой чепухой?

cobold ★★★★★
()
Ответ на: комментарий от yu-boot

что ещё останется от опенсорса с таким подходом?

Собственнический опенсорс. Иначе к чему слова о «краже» в обсуждении?

Пока Луну кто-нибудь пиратски не захватил в собственность, «украсть» её невозможно.

vM ★★
()
Ответ на: комментарий от firkax

Увы, с вами не согласны огромные корпорации, у некоторых из которых основной источник дохода - алгоритм, который хранится в Azure DevOps. MS грамотно подсадил корпорации на иглу своих технологий разработки софта.

Только недобитые гики и софтварные корпы могут позволить себе закрыться в себе и никому не отдавать свои исходники.

Irben ★★★
()
Ответ на: комментарий от firkax

Что за узаконенное воровство? Если код переписан иначе, то это уже другой код. Вы безо всякой нейросети можете взять и переписать чей-то код иначе и он станет вашим. Иначе просто были бы невозможны альтернативные реализации.

Доказать ничего невозможно, особенно если код будет переведён на другой язык.

ИИ далеки от совершенства и это несовершенство не исправится ы ближайшее время. Достаточно большой кусок кода сгенерированного ИИ, особенно кода не типичного и не тривиального, неизбежно будет содержать ошибки, если не синтаксические, то логические. Примерно как сейчас ИИ рисует по 7 пальцев или ответы в стиле «в огороде бузина, в Киеве - дядька». У ИИ нет второго «И». Он не понимает что делает и зачем. Это очень продвинутый T9.

Если же для какой-то задачи ИИ выдаёт безошибочный код, это значит, что задача уже была настолько обмусолена людьми, имеет столько обучающих выборок, кто вновь решать её человеку не имеет смысла.

Наконец, никому не нужен просто код. Нужен сопровождаемый код. Ждать от ИИ, что он не просто перепишет чужой код, но ещё и будет грамотно поддерживать его, выполняя запросы в стиле «того же, но с перламутровыми пуговицами» не стоит. По описанный выше причине рано или поздно он сломается и начнёт писать фигню. Ну или промпты потребуются столько подробные, что проще будет написать самому.

Открытый код, который вы спрятали и никому не показываете, это на самом деле не открытый код. Что бы там не было написано в лицензии.

Ну и в заключении это практически невозможно оформить юридически. Потому что ИИ это просто читающая текст программа, мало чем отличающаяся от текстового редактора, статического анализатора, контроля синтаксиса или генератора подсказок.

Придётся или отказаться почти от всех возможностей IDE или сдаться. Потому что нейросетям не обязательно что-то делать за один шаг. Они могут обучиться (и на примере картинок уже делают) трюку с чистой комнатой. Т.е. нейросеть A, обученная на одной выборке, читает подсунутый исходник, которого в выборке не было и генерирует не код, а промпт для нейросети B, обученной на другой выборке, в которой тоже не было этого исходника, но которая сгенерирует программу, делающую то же самое.

atrus ★★★★★
()
Ответ на: комментарий от atrus

Если код переписан иначе, то это уже другой код. Вы безо всякой нейросети можете взять и переписать чей-то код иначе и он станет вашим. Иначе просто были бы невозможны альтернативные реализации.

Тут речь как раз про то, то если ты просто скопипастишь код и сделаешь незначительные правки - это могут признать кражей (не суть как называть) и постановить прекратить этим заниматься. А если ты сделаешь ровно то же самое, но скажешь «этот код мне сгенерировал ИИ, обученный на исходниках истца» - то тебя могут оправдать и всё разрешить. Опасность не в самом ИИ, а в том, что он теперь может быть законной отмазкой даже там, где реально его и не было.

Открытый код, который вы спрятали и никому не показываете, это на самом деле не открытый код. Что бы там не было написано в лицензии.

Я не призывал прятать код.

Ну и в заключении это практически невозможно оформить юридически. Потому что ИИ это просто читающая текст программа

Да пусть читает. Суть в том чтобы вывести из законной плоскости чью то отмазку «я на вашем коде обучил своё ИИ и поэтому так получилось». Опять - было ли там на самом деле ИИ или нет - не важно, важна отмазка с отсылкой к нему.

firkax ★★★★★
() автор топика
Ответ на: комментарий от firkax

А если ты сделаешь ровно то же самое, но скажешь «этот код мне сгенерировал ИИ, обученный на исходниках истца» - то тебя могут оправдать и всё разрешить

Не могут. Повторение «потусторонними силами» не является оправданием для использования. Авторство относится к конкретному произведению, а не к человеческому способу его создания.

vaddd ★☆
()
Ответ на: комментарий от firkax

могут … постановить прекратить этим заниматься.

Любой, кто прочитал опубликованный Вами код, может придумать, как сделать лучше или просто по-другому. Вы не в силах это запретить: это естественное право читателя.

vM ★★
()
Ответ на: комментарий от firkax

А если ты сделаешь ровно то же самое, но скажешь «этот код мне сгенерировал ИИ, обученный на исходниках истца» - то тебя могут оправдать и всё разрешить.

Очень сомнительно. ИИ не имеет авторских прав, т.е. для суда этот код всё равно что написал ты сам. Но вроде бы отмазки «я сам написал точно такой же код» не прокатывают. Google с Oracle срались за описание API, SCO с Linux за файл заголовка.

atrus ★★★★★
()
Ответ на: комментарий от vM

Тут примерно как с Пушкиным - любой может прочитать «Онегина» и написать лучше ) Но в софте, к сожалению (или к счастью?) практической ценностью является не красота стиля, а эффективность алгоритма и отлаженность кода. Авторское право их мало защищает, поэтому любой истинный опенсорсник подобен внезапно разнагишавшейся девушке посреди восточного базара - скрывать больше нечего и помешать взять что хочется тоже нечем )

vaddd ★☆
()
Ответ на: комментарий от vaddd

Да нет, чистые комнаты именно для того и делают, чтоб доказать, что получившийся похожий результат - не копипаст, и законен. А если точно такой же результат делается с параллельно открытым окном с чьим-то чужим кодом - законность уже страдает.

firkax ★★★★★
() автор топика
Ответ на: комментарий от vM

Вы не в силах это запретить: это естественное право читателя.

Закон запрещает «делать лучше», параллельно затирая исходные копирайты и лицензии. А через бекдор с ИИ (точнее, через бекдор с отмазкой про ИИ) это получается возможно.

firkax ★★★★★
() автор топика
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)