LINUX.ORG.RU
ФорумTalks

Что почитать по машинному обучению?

 


3

1

Достался в наследство код с логистической регрессией. Хочется не просто применять, но и понимать что происходит чтобы иметь возможность что-то изменить, т.к. на сколько мне известно, не факт, что один подход будет успешно работать во всех случаях в контексте машинного обучения.

В связи с этим вопрос: что почитать? Литературы по машинному обучению огромное количество, но с чего начать…

Конкретно по регрессии - обычный матан - функциональный анализ, линейная оптимизация...

Shadow ★★★★★
()

с чего начать…

Машинное обучение © / Логистическая регрессия © / Пример на модельных данных ©.

quickquest ★★★★★
()

Обоженьки, весь ЛОР читает научную литературу с зубодробительно сложными концепциями на англицком как на родном. Кого вы хотите обмануть? Вы же и половины там не понимаете, даже если знаете перевод каждого слова и стандартных сочетаний. Кончайте заниматься профанацией.

Xintrea ★★★★★
()
Ответ на: комментарий от ya-betmen

Писали люди на другом языке, с другой картиной мира, другими общими знаниями, с другой культурой, с другой историей, с другим представлением о том как и про что надо писать. Для того, чтобы их адекватно понимать, надо родиться и вырасти в их стране: в любом случае надо провести в их среде хотя бы не менее четверти века, а желательно - всю жизнь. Тогда можно о каком-либо понимании говорить. Тем более о понимании сложных тем.

Xintrea ★★★★★
()
Ответ на: комментарий от Xintrea

Ну как бы кроме тебя в этот тред рандомов не залетело пока.

По теме ТС-у порекомендую почитать https://loginom.ru/blog/logistic-regression-roc-auc ну и вообще базовые алгоритмы машинного обучения они обсосали. Хотя я на английском предпочту читать, т.к. в терминологии у нас есть некоторые расхождения и проще запутаться, один фиг код в либах пишут англоязычные или хотя бы англоговорящие челики.

peregrine ★★★★★
()
Ответ на: комментарий от Xintrea

Чушь. Вот тебя реально трудно понять. А чтоб челиков понимать которые внезапно тоже люди достаточно быть человеком.

peregrine ★★★★★
()
Ответ на: комментарий от Xintrea

Но не инопланетяне же. К тому же на инглише. К тому же, как я сказал, на американском/английском инглише. Если уж худлит можно читать, то в чем проблема с тех. литературой?

ya-betmen ★★★★★
()
Ответ на: комментарий от peregrine

Вот ты сейчас отказал мне в том, что считаешь меня человеком, потому что с трудом меня понимаешь. Другими словами, ты уже до расчеловечения скатился. Тебе ближе абстрактные челики, уж их-то ты хорошо понимаешь.

Xintrea ★★★★★
()
Ответ на: комментарий от ya-betmen

Если уж худлит можно читать, то в чем проблема с тех. литературой?

В том, что от тебя постоянно ускользают важные моменты, которых ты даже не замечаешь. Для худлита это отчасти простительно, для научной и технической литературы - нет.

Xintrea ★★★★★
()
Ответ на: комментарий от Xintrea

Писали люди на другом языке

В средние века такие вещи писали на латыни и как-то это никому не мешало. Не нужно было изобретать машину времени чтобы пожить в Римской империи.

no-such-file ★★★★★
()
Ответ на: комментарий от no-such-file

писали на латыни и как-то это никому не мешало.

Только читать латынь могло 0,1% тогдашнего населения. Собственно автор и пара тройка, край десяток, его друзей которым он в приватной переписке и пояснял что он имел в виду.

Ygor ★★★★★
()
Ответ на: комментарий от Xintrea

Всё ровно наоборот. Какие-то тонкие культурные моменты важны в худлите (и то, даже его можно без проблем читать, более того, иногда даже в переводе может быть почти норм), а в технической литературе им попросту негде всплыть. Чем сложнее и техничнее тема, тем меньшее знание иностранного языка для неё требуется. Какие-нибудь фундаментальные исследования вообще можно чуть ли на любом европейском языке читать без специального изучения этого языка, либо при некоторой эрудиции, либо используя словари и автопереводчики. А уж на английском так подавно. Кстати, всякие мануалы и литература по программированию на английском читается намного проще, чем на русском.

CrX ★★★★★
()
Ответ на: комментарий от Xintrea

ускользают важные моменты

Это как раз для худлита критично, те части, где бывают всякие *примечания переводчика про отсылки к истории/литературе/политике/етц.

Для тех литературы всё что не выражается в псевдокоде/коде/формулах можно пропустить.

ya-betmen ★★★★★
()
Ответ на: комментарий от CrX

Меня всегда веселят люди, которые свято верят, что вся англоязычная техническая литература написана точно и понятно. А когда начинаешь смотреть глубже, оказывается, что эти люди попросту лукавят. Возможно, они так рады своему превосходству в знании англицкого перед необразованным быдлом, что не замечают, что у них-то как раз полного понимания темы попросту не формируется.

Вот простой пример. Понадобилось понять, что делает функция glob() в языке PHP. Смотрим доку:

https://www.php.net/manual/en/function.glob.php

glob — Find pathnames matching a pattern

Description

glob(string $pattern, int $flags = 0): array|false

The glob() function searches for all the pathnames matching pattern according to the rules used by the libc glob() function, which is similar to the rules used by common shells.

Сразу становится вопрос: а что имеется в виду под словом «find»? Поиск? Хорошо, но какой это поиск? Рекурсивный в подкаталогах или нет? Если бы было написано что-то типа «выборка» (select, fetch), то по моим культурным представлениям я бы подумал, что имеется в виду выборка из текущей директории (не из под-директорий). Но англоговорящие авторы написали find. А я, как разрабочик, знаю команду find, которая ищет рекурсивно. Для меня find по файловой системе - это всегда рекурсивный поиск. Так что я должен подумать? На этот момент авторы внимания не обращают.

Тогда, может быть, нейросеть, статистически объеденив все знания документации, stack overflow, и кучи англоязычных книжек по программированию на PHP сможет мне дать ответ? Посмотрим:
В: Берет ли функция glob() файлы рекурсивно из поддиректорий,
или она работает только на уровне одной директории?

О: Функция glob() по умолчанию работает только на уровне
одной директории и не рекурсивно сканирует поддиректории.
Однако, если в качестве шаблона использовать путь с шаблоном,
включающим поддиректории, то glob() также будет искать файлы
в поддиректориях. Вот пример использования glob() для поиска файлов в поддиректориях:

 $files = glob("*.*", GLOB_BRACE|GLOB_ONLYDIR);
 foreach ($files as $dir) {
    $files_in_subdir = glob("$dir/*.*"); // Обработка файлов в поддиректориях
 }

Этот код найдет все файлы в текущей директории и ее
поддиректориях. Однако, если вам нужно рекурсивно сканировать
поддиректории для поиска файлов, то вам, возможно, придется
написать свою собственную рекурсивную функцию или использовать
сторонние библиотеки.

Вот такая белиберда. Так все-таки, рекурсивно или нет работает функция glob()? Или ее работа зависит от того, какой шаблон будет написан? И есть некий шаблон, который говорит что надо искать в поддиректориях? Значит, способна рекурсивно? Ведь не просто так сделана опция GLOB_ONLYDIR:
GLOB_ONLYDIR (int)
    Return only directory entries which match the pattern

И тут тоже тонкий момент: как перевести это предложение? «Возвращает только те записи каталога, которые соответствуют шаблону»? А может быть «Возвращает только вхождение директорий, которые попадают под паттерн», что бы это ни значило. Я то понимаю, что учитывая пример кода (спасибо, ChatGPT хоть на этом), переводить нужно как «Возвращает только те вхождения, которые являются директориями и попадают под заданный паттерн». Хорошо, с этим разобрались.

Но остался вопрос: как же все-таки ищет функция glob()? Какие действия она выполняет? Мы разгребли документацию, но ничего не поняли.

Вот сколько проблем возникает при чтении маленького кусочка чисто технического английского текста. Никакой художественной литературы тут нет. И понимания тут тоже нет. И так бороться нужно буквально с каждым абзацем. Что-то я сомневаюсь, что чтение технической литературы с такими трудностями приведут к пониманию предмета. Если, конечно, вы эти трудности видите, а не обходите стороной, пропуская по принципу «ну в общем понятно, а что там точно - да кого бы это волновало».

Xintrea ★★★★★
()
Ответ на: комментарий от Xintrea

Меня всегда веселят люди, которые свято верят, что вся англоязычная техническая литература написана точно и понятно. А когда начинаешь смотреть глубже, оказывается, что эти люди попросту лукавят.

Думаю, что подавляющее большинство из тех, кто это заявляет, не лукавит. И никакой святой веры здесь нет, лишь опыт чтения так и эдак и сравнение результата.

Но я вполне допускаю, что это индивидуально, и что кому-то (вам, видимо) удобнее и маны тоже читать на русском. У всех свои индивидуальный особенности, это нормально.

Возможно, они так рады своему превосходству в знании англицкого перед необразованным быдлом

У вас СПГС. Никто не радуется никакому превосходству, да и знанием английского (тем более на уровне чтения технической документации) сегодня уж точно никого не удивишь, здесь нечем особо гордиться и пытаться выделиться.

Вот простой пример. Понадобилось понять, что делает функция glob() в языке PHP. Смотрим доку:
[…]
Сразу становится вопрос: а что имеется в виду под словом «find»? Поиск? Хорошо, но какой это поиск? Рекурсивный в подкаталогах или нет?

Замечательный пример плохой (недостаточно подробной) документации. Только причём тут язык? Точно так же плохо можно документировать на любом языке. И вот на русском такое встречается чаще.

Или ты серьёзно веришь, что если бы этот абзац был написан точно так же скупо, но по-русски, было бы понятнее, рекурсивный это поиск или нет, и остальные подробности? Или что в первой строке там был бы не поиск, а выборка?

Тогда, может быть, нейросеть, статистически объеденив все знания документации, stack overflow, и кучи англоязычных книжек по программированию на PHP сможет мне дать ответ? Посмотрим

Ну а это вообще к чему? Что это должно доказать или иллюстрировать в вопросе, на каком языке документация в среднем понятнее?

Return only directory entries which match the pattern

А тут всё прекрасно понятно из контекста. Да даже из ONLYDIR в названии.

И так бороться нужно буквально с каждым абзацем. Что-то я сомневаюсь, что чтение технической литературы с такими трудностями приведут к пониманию предмета. Если, конечно, вы эти трудности видите, а не обходите стороной, пропуская по принципу «ну в общем понятно, а что там точно - да кого бы это волновало».

Всё верно. Читать техническую литературу непросто, и делать это надо вдумчиво, и не всегда она написана на 100% хорошо и однозначно, при этом так, чтоб даже без контекста было понятно. Всё так. Только вот язык к этим проблемам отношения не имеет вообще — они одинаковые хоть на английском, хоть на русском, хоть на латыни какой-нибудь. Думаю, на китайском тоже, хотя возможно, что там есть свои особенности, всё же китайский язык слишком сильно отличается от индоевропейских.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 3)
Ответ на: комментарий от Ygor

Только читать латынь могло 0,1% тогдашнего населения

В принципе читать могло 0.1% населения. Но они уж читали и на латыни тоже.

которым он в приватной переписке

В ватсапе, ага.

no-such-file ★★★★★
()
Ответ на: комментарий от Xintrea

Хосспади… Английский язык в таких книгах - это самое простое, сам мета-язык очень примитивен. Это тебе не Оскар Уайльд. Не в английском проблемы, не в английском.

seiken ★★★★★
()
Ответ на: комментарий от Xintrea

Меня всегда веселят люди, которые свято верят, что вся англоязычная техническая литература написана точно и понятно. А когда начинаешь смотреть глубже, оказывается, что эти люди попросту лукавят.

Конечно, нет. Но за счёт её количества и общей успешности их экономик что-то для себя точно можно найти. Поэтому в нормальных библиотеках нормальных универов всегда есть англоязычные издания, если на родном подобных не имеется. И даже если есть качественный перевод на русский, переводчик только переводит, а задачи научить читателя у него нет.

seiken ★★★★★
()
Ответ на: комментарий от Ygor

То Грозный. Он мог не то, что послать людей отнести письмо, а самих адресатов доставить к нему (независимо от их желания).

no-such-file ★★★★★
()

я бы начал с повторения тервера и матстата. Потому что все эти ваши логистические регрессии - по сути оно и есть.

Lrrr ★★★★★
()
Ответ на: комментарий от no-such-file

То Грозный. Он мог не то, что послать людей отнести письмо, а самих адресатов доставить к нему (независимо от их желания).

Большинство адресатов находились в других странах.

question4 ★★★★★
()
Ответ на: комментарий от CrX

У вас СПГС. Никто не радуется никакому превосходству, да и знанием английского (тем более на уровне чтения технической документации) сегодня уж точно никого не удивишь

Когда документация написана хреново на русском, я точно могу сказать что авторы мудаки.

Когда документация написана хреново на английском, я могу только поразмышлять на тему, что видимо я чего-то не понимаю. Возможно, я не вижу тонких взаимосвязей в нагромождении слов, возможно я не понимаю кто на ком стоял, мало ли что от меня ускользает. И то, что документация тупо написана хреново, я это даже оценить не могу.

Видимо, есть люди, которые настолько хорошо знают английский как родной, что они мгновенно понимают что авторы документации сработали хреново, и что в ней нечего искать адекватных знаний. Наверно, этим людям хорошо живется с таким то понятийным аппаратом. Я к таким людям не отношусь.

Xintrea ★★★★★
()
Ответ на: комментарий от Xintrea

Возможно, я не вижу тонких взаимосвязей в нагромождении слов, возможно я не понимаю кто на ком стоял, мало ли что от меня ускользает. И то, что документация тупо написана хреново, я это даже оценить не могу.

Такая проблема обычно с художкой возникает. Бывает, что без культурного контекста ускользают какие-то смыслы, даже при отличном знании непосредственно языка, или просто знания языка подводит, всяких идиом и т.п.

Но с документацией довольно просто. Или информация там есть, или её нет. В данном случае очевидно, что её тупо нет — её негде спрятать. Чтобы это понять, не требуется особо продвинутое знание английского языка. Другое дело, что бывает, когда информация может быть двояко понята — тут да, знание языка имеет первоочерёдное значение. Но, кстати, в технической документации даже носители языка такого стараются избегать, возможно, не всегда получается. Но когда не двояко, а тупо информации не хватает, то этот факт понятен хоть на английском, хоть на русском, хоть на латыни.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

Но когда не двояко, а тупо информации не хватает, то этот факт понятен хоть на английском, хоть на русском, хоть на латыни.

Хех, маны в Linux по такому принципу и пишутся. Чтобы понять ман ты должен заранее знать всю предметную область.

Xintrea ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)