LINUX.ORG.RU
ФорумTalks

Над РеактОСью сгущаются тучи

 ,


0

3

Аксель Ритчен (Axel Rietschin), инженер компании Microsoft, занимающийся разработкой ядра Windows, поставил под сомнение возможность разработки операционной системы ReactOS без заимствования кода из Windows. По его мнению разработчики ReactOS воспользовались кодом из ядра Windows Research, исходные тексты которого лицензировались для университетов. Утечки данного кода публиковались в различных местах, в том числе на GitHub.

Ритчен уверен, что физически невозможно с чистого листа написать ядро ReactOS в том виде, как написано оно сейчас, пользуясь только имеющейся публичной документацией. В частности, имена внутренних структур и функций в ядре ReactOS совпадают с аналогичными именами в ядре Windows Research, в то время как эти имена не экспортируются при сборке и нигде не светятся кроме оригинального кода. То же касается имён макросов и параметров, имена которых невозможно точно воспроизвести не заглядывая в оригинальный код Windows.

https://www.opennet.ru/opennews/art.shtml?num=51023

Deleted
Ответ на: комментарий от shkolnick-kun

Это - уже выход в серую зону, но думаю, что это было согласовано с кем надо...

Может я не совсем понял, но что было бы нарушено, если результат работы (морфологическая разметка) честно приобретенной программы использовать для другой программы (обучалки)? Выход одной программы - вход другой. Такое сплошь и рядом делается, с чего вдруг для нейросеток какое-то специальное разрешение требуется?

А передать он не мог корпусной словарь (аналог pymorphy), если бы передал - был бы явный косяк.

Это была часть другой программы, со своей лицензией. Тут все понятно.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 2)
Ответ на: комментарий от lenin386

Вообще пох как называются функции. Решает что они конкретно делают и «как они это делают». Если «точно так же» — подозрительно, «а вот и пруфы, ваша честь», а если по-другому — «обознатушки-перепрятушки, конвой свободен». А если лучше — ну только что-то вроде шумихи в ж. прессе «мы первые так придумали, давно так хотели сделать, но... но. но! очки запотели» (ТМ)

slackwarrior ★★★★★
()
Ответ на: комментарий от mbivanyuk

там надо, чтобы код совпадал чота вроде 90% и выше. так что не докажут.

Iron_Bug ★★★★★
()
Ответ на: комментарий от praseodim

Может я не совсем понял, но что было бы нарушено, если результат работы (морфологическая разметка) честно приобретенной программы использовать для другой программы (обучалки)?

Там был использован размеченный датасет (корпус), соответственно, результат обучения (веса сетки) является производной работой от датасета.

А дальше вопрос - давал ли правообладатель на использование его произведения для создания производной работы?

Думаю, что давал...

shkolnick-kun ★★★★★
()
Ответ на: комментарий от shkolnick-kun

Там был использован размеченный датасет (корпус), соответственно, результат обучения (веса сетки) является производной работой от датасета.

Мне не очевидно, что это производная работа. Если так рассуждать, то наверное все работы являются производными от чего-то.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Тут как с GPL и переводом программ с одного ЯП на другой: то, что оно изложено на другом языке, не делает такую программу новым независимым произведением.

shkolnick-kun ★★★★★
()
Последнее исправление: shkolnick-kun (всего исправлений: 2)
Ответ на: комментарий от shkolnick-kun

Может я чего не понял, но в общем случае готовая нейросетка - не изложение датасета, он в ней не присутствует ни в каком виде, а также не восстанавливается из нее обратно. Так можно дойти до того, что если в программе использованы формулы из учебника, то это производная работа от учебника. И то больше оснований даже.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)

Ритчен уверен, что физически невозможно с чистого листа написать ядро ReactOS в том виде, как написано оно сейчас, пользуясь только имеющейся публичной документацией. В частности, имена внутренних структур и функций в ядре ReactOS совпадают с аналогичными именами в ядре Windows Research,

Тут есть одна лажа. Приличная часть WinAPI как ядрёного, так и юзверьского официально недокументирована. При этом много софта используют эти недокументированные функции, структуры, флаги, недокументированное поведение, даже баги и всё такое прочее, соответственно, не реализовав это всё, приличная часть софта не будет работать. Поэтому создать ОС на которой работает весь софт для винды без реализации недокументированного невозможно. Однако, чтобы узнать названия функций, структур и всей прочей недокументированной требухи совершенно необязательно смотреть сырцы именно венды. Более того, многие вещи можно просто из бинарника софтины вытащить, особенно если софтина была собрана с данными для дебага.

Так что попытка повалять дурочку типа «111!!! у них в коде наша секретная недокументированная функция так же назвается, такую же структуру пользует и так же работает, а мы не выкладывали для хомячков её описания !!!!1111» вряд-ли удачная, ибо как минимум теоретически это всё можно выяснить и без заглядывания в микрософтовский говнокод.

Stanson ★★★★★
()
Последнее исправление: Stanson (всего исправлений: 1)
Ответ на: комментарий от praseodim

Может я чего не понял, но в общем случае готовая нейросетка - не изложение датасета, он в ней не присутствует ни в каком виде, а также не восстанавливается из нее обратно.

Может я чего не понял, но в общем случае стрипаный бинарник - это не изложение исходника, исходник не присутствует в стрипаном бинарнике ни в каком виде, а так же не восстанавливается из него обратно.

Размеченный датасет - описание поведения технической системы (например - нейросети).

Обученная нейросеть - техническая система, реализующая поведение, описанное в датасете.

shkolnick-kun ★★★★★
()
Ответ на: комментарий от Barracuda72

Ну вообще-то они следуют тому же стилю кода, что и Windows, в т.ч. в плане именования...

Диск C, диск D?

burato ★★★★★
()
Ответ на: комментарий от Barracuda72

Ну вообще-то они следуют тому же стилю кода, что и Windows, в т.ч. в плане именования

В коде винды тоже в одной строчке смешиваются венгерская нотация, CamelCase и snake_case?

gremlin_the_red ★★★★★
()
Ответ на: комментарий от shkolnick-kun

Размеченный датасет - описание поведения технической системы (например - нейросети).

Может быть в понимании терминов не сходимся? Я под датасетом понимаю набор данных, в виде пригодном для тренировки нейросетки. В общем виде это может быть набор пар (исходные данные, результат) и нейросетка выстраивает какой-то набор коэффициентов в каких-то алгоритмах, чтобы в дальнейшем получать такие же или близкие результаты. В примитивном виде даже генерация коэффициентов для интерполяционных кривых - это тренировка ;))

Аналогии с исходником и откомпилированной программой не вижу.

praseodim ★★★★★
()
Ответ на: комментарий от Stanson

Однако, чтобы узнать названия функций, структур и всей прочей недокументированной требухи совершенно необязательно смотреть сырцы именно венды. Более того, многие вещи можно просто из бинарника софтины вытащить, особенно если софтина была собрана с данными для дебага.

Вроде бы как я понял автор говорит о случаях, когда такие названия не вытаскивались вообще не откуда. Например, если это не экспортируемая константа, а символы после компиляции из бинарника стрипнуты. Но оппоненты заметили, что частенько символы забывали стрипнуть в апдейтах, каких-то sdk и т.п.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Я под датасетом понимаю набор данных, в виде пригодном для тренировки нейросетки. В общем виде это может быть набор пар (исходные данные, результат) и нейросетка выстраивает какой-то набор коэффициентов в каких-то алгоритмах, чтобы в дальнейшем получать такие же или близкие результаты.

Именно так.

Аналогии с исходником и откомпилированной программой не вижу.

А она есть. Разница только в способе описания поведения (в одном случае - на формальном языке, в другом - в виде примеров/тестов).

Датасет - это такое «ТЗ», обучил сетку на датасете - реализовал «ТЗ».

У ТЗ есть правообладатель, строго говоря, - ты не имеешь права использовать чьё-то ТЗ при создании своего продукта без согласия правообладателя.

shkolnick-kun ★★★★★
()
Последнее исправление: shkolnick-kun (всего исправлений: 2)
Ответ на: комментарий от praseodim

Вроде бы как я понял автор говорит о случаях, когда такие названия не вытаскивались вообще не откуда. Например, если это не экспортируемая константа, а символы после компиляции из бинарника стрипнуты.

Она может быть не стрипнута в сторонней софтине, которая её использует и эту софтину писала контора, которой мелкософт дал сырцы венды.

Но оппоненты заметили, что частенько символы забывали стрипнуть в апдейтах, каких-то sdk и т.п.

И это тоже.

Stanson ★★★★★
()
Ответ на: комментарий от shkolnick-kun

А она есть. Разница только в способе описания поведения (в одном случае - на формальном языке, в другом - в виде примеров/тестов).

Давай конкретный пример приведу. Допустим, тренируется свой OCR и/или автоматический каталогизатор текстов . Датасет - натасканные из интернета тексты (для ocr - pdf и djvu c текстовым слоем) книг (в том числе о ужас «пиратские тексты»). И найденные им соответствующие индексы ББК, УДК. В чем тут будет «производная» работа у нейросетки и у кого надо спрашивать лицензию и на что именно?

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Веса будут производной работой от... Шрифтов...

А ещё ты использовал чьи-то тексты без согласия авторов в качестве разметки.

Суть не в том, содержит или нет, а в воспроизведении без согласия правообладателя.

Хотя практически что-либо доказать будет трудно.

shkolnick-kun ★★★★★
()
Последнее исправление: shkolnick-kun (всего исправлений: 2)
Ответ на: комментарий от shkolnick-kun

Хотя практически что-либо доказать будет трудно.

Кроме того, а кто тут такой «потерпевший», что он доказывать чего-то станет?

Но вообще вопрос в праве на использование чужих результатов. По-моему, в общем виде оно не регулируется вообще.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Кроме того, а кто тут такой «потерпевший», что он доказывать чего-то станет?

В РАО, MPAA, RIAA, BSA разберутся.

По-моему, в общем виде оно не регулируется вообще.

ГК ч. 4?

shkolnick-kun ★★★★★
()

Проводили же уже аудит кода. Хотя дело давно было.

hobbit ★★★★★
()
Ответ на: комментарий от Deleted

Чё за ИПВ? Яндекс только вакцины и определители ветра находит.

hobbit ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.