LINUX.ORG.RU
ФорумTalks

Импортозамещение и процент Linux на десктопах

 , , ,


0

1

На тему наблюдаемости внедрения Linux в РФ.

Далее на типа серьезных щщах:

Процент Linux на пользовательских устройствах может быть оценен по относительной частоте встречаемости уникальных пар (IP, user-agent) при доступе к веб-серверам. Статистика собирается, например, statcounter.com по описанной ими методике. Из описания методики неясно, на каком именно наборе сайтов набирается статистика, как именно ОС распознается по user-agent, и как оценивается систематическая неопределенность измерений. На наличие у statcounter.com неконтролируемых систематических неопределенностей указывают, в частности, выходящие за рамки статистических флуктуаций колебания доли Linux в РФ от ~2% до 8-10% в 2021 г. (https://ibb.co/587zdr0).

Можно ли наблюдать статистически значимый эффект импортозамещения/внедрения Linux в РФ по относительной частоте (IP, user-agent)?

Оценки источников типа statcounter.com имеют неконтролируемую систематику, поэтому делаем независимую оценку по логам httpd, до которых добрались под Новый год (с помощью откликнувшихся товарищей) grep-ом:

cайт на русском языке, не технический, тематика биология/медицина; материал, в основном, популярный; посещаемость очевидна из статистических ошибок ниже.

Исключаем запросы из сетей, для которых по маске /16 whois не возвращает ‘country: RU’; исключаем оставшихся распространенных ботов (yandex.*bot|bot/|crawler|rowler|…); оставляем набор пар (IP, user-agent); идущие подряд одинаковые пары (IP, user-agent) заменяем на одну; подсчитываем частоту встречаемости user-agent по шаблонам ниже в процентах, приводим статистические ошибки:

                : 11-19 Dec 2022 : 05-15 Dec 2024 
--------------------------------------------------
Windows         : 49.7 +- 1.0    : 32.9 +- 1.4    
Android         : 24.4 +- 0.6    : 17.2 +- 0.9    
iPhone          : 17.1 +- 0.5    : 32.5 +- 1.4    
OS X            :  2.7 +- 0.2    :  5.9 +- 0.5    
Linux X11       :  0.7 +- 0.1    :  3.4 +- 0.4  *
Linux non-X11   : 0.01 +- 0.01   :  0.4 +- 0.1  * 
X11 non-Linux   : 0.08 +- 0.03   : 0.04 +- 0.04   
Mobile Safari   :  0.7 +- 0.1    :  0.6 +- 0.2    
Others          :  4.9 +- 0.3    :  7.9 +- 0.6    
--------------------------------------------------

Видно, что с середины декабря 2022 г. по середину декабря 2024 г. процент Linux/X11 статистически значимо возрос c 0.7+-0.1 до 3.4+-0.4. Виден также рост Linux не-X11 (не включает Android) – это сигнатура браузеров, работающих поверх Wayland?

Если есть желающие воспроизвести это независимо на доступных логах apache, короткий скрипт могу положить сюда.

★★

Linux не-X11 (не включает Android) – это сигнатура браузеров, работающих поверх Wayland?

Насколько я помню, андроиды тоже пишут Linux+X11 в юзер-агенте. И вайландобраузеры тоже. Ну, может не все, но некоторые. Так что наличие/отсутствие X11 можно не учитывать.

firkax ★★★★★
()
Ответ на: комментарий от firkax

Насколько я помню, андроиды тоже пишут Linux+X11 в юзер-агенте.

Добавил grep -vi android перед проверкой на Linux/X11. Проценты Linux + X11 не поменялись в пределах ошибок.

x22 ★★
() автор топика

По твоей статистике вдвое выросли количества iPhone и OS X. Нормальное такое «импортозамещение».

Tigger ★★★★★
()
Ответ на: комментарий от Tigger

А Windows уменьшилась в полтора раза. Круговорот гомна в природе.

Смотрите на Linux, которое не Android.

x22 ★★
() автор топика

это сигнатура браузеров, работающих поверх Wayland?

Насчёт остальных не скажу, но Огнелис под Wayland пишет про X11:

Mozilla/5.0 (X11; Linux x86_64; rv:133.0) Gecko/20100101 Firefox/133.0

QsUPt7S ★★
()
Ответ на: комментарий от Tigger

Так «импортозамещение» это не про хомяков.

anc ★★★★★
()

cайт на русском языке, не технический, тематика биология/медицина; материал, в основном, популярный

Описание источника получения данных выглядит сомнительно.

dmitry237 ★★★★
()

Рост есть, потенциал есть, вопрос, какой процент на десктопах в России может занять линукс? Ясно, что не 100%

tiinn ★★★★★
()

Я не думаю, что кто-то из домашних пользователей перешел на Линукс из-за какого-то там «импортозамещения».

MoldAndLimeHoney
()

Виден также рост Linux не-X11 (не включает Android) – это сигнатура браузеров, работающих поверх Wayland?

Не, на Wayland как минимум огнелис всё равно X11 пишет в юзерагенте. Вот у меня такой сейчас: Mozilla/5.0 (X11; Linux x86_64; rv:133.0) Gecko/20100101 Firefox/133.0. На вяленом.

CrX ★★★★★
()
Ответ на: комментарий от MoldAndLimeHoney

А в статистике только домашние пользователи? Тогда никакой особой разницы видно не должно быть. Ведь действительно, менять рабочий десктоп на гномовское недоразумение никто не будет. Вот кстати аккурат перед НГ говорил с родственником на счёт нового ноута. У него из спец прог только R, но датасеты очень маленькие. Привык к макбуку. Хотел взять ноут на винде за 500евро. Я ему, разумеется, сказал, что у макбука (даже самого дешёвого) и клава и время батареи не в пример будет лучше оных ноута за 500е. Линукс вообще не рассматривался, потому что человеку надо для работы, а не красноглазых экспериментов.

seiken ★★★★★
()
Последнее исправление: seiken (всего исправлений: 2)
Ответ на: комментарий от CrX

Не, на Wayland как минимум огнелис всё равно X11 пишет в юзерагенте

Значит, рост Wayland так не отловишь.

Сумма Linux X11 и Linux не-X11 (после исключения Android) выросла так или иначе.

Конечно, это может отражать изменение аудитории конкретного сайта за 2 года по внешним причинам.

x22 ★★
() автор топика
Ответ на: комментарий от dmitry237

Описание источника получения данных выглядит сомнительно.

Ссылку не пишу принципиально. Мопед не мой.

x22 ★★
() автор топика
Ответ на: комментарий от seiken

А в статистике только домашние пользователи?

В данном случае могут быть школьнеги/студенты.

Что творится во всяких МОУ, можно только гадать.

x22 ★★
() автор топика
Ответ на: комментарий от x22

Т.е. исходя из разряда процентов и из того, что:

посещаемость очевидна из статистических ошибок

то речь идет о 10 тыс. посещений за 10 дней? 365 тыс. уникальных посещений в год, можно ли это назвать достаточным для выводов? Ну наверное с натяжкой.

dmitry237 ★★★★
()
Ответ на: комментарий от dmitry237

то речь идет о 10 тыс. посещений за 10 дней?

При относительной стат. ошибке ~1% число уникальных пар (IP, u-a) ~10^4.

365 тыс. уникальных посещений в год, можно ли это назвать достаточным для выводов?

Дело не в абсолютных числах, а в на сколько сигм отличаются доля Linux в 2022 и 2024. Между 0.7+-0.1 и 3.4+-0.4 больше 5 сигм. Вероятность того, что это два измерения одной и той же (то есть с фиксированным распределением) случайной величины меньше 10^-6.

Значит, прОцент линукса изменился систематически.

Это не значит, что абсолютное число юзеров с линуксом выросло. Статистически значимо вымерли виндузятнеги, например.

x22 ★★
() автор топика

если исходить из вашей статистики, то Windows в основном замещали ай-фонами и маками :-)

MKuznetsov ★★★★★
()
Ответ на: комментарий от MKuznetsov

Windows + iPhone ~ константа. Возможно, аудитория молодеет.

Важно то, что меняется относительная доля обычного линукса.

// Предполагаю, что если взять распределение в новогодние праздники, то доля Linux X11 (не андроид) взлетит в разы.

x22 ★★
() автор топика

Когда-то давным-давно у меня был бложик на вордпрессе, куда ходил я, мои друзья-линуксоиды и ещё друзья-нелинуксоиды.

Ещё у меня там был прикол, что поскольку дизайн бложика криво показывался в IE (это было реально давно), то для IE я сделал отдельную примитивную версию. IE был уже на излёте, пользователей было мало.

И вот однажды я решил статистику проверить, а много ли вообще людей получают IE-only версию бложика, много ли людей пользуются IE. Может, выкинуть всё это страхомудие? Для этого я водрузил на сайт счётчик statcounter и сел в засаду выжидать.

Ну и что я увидел через пару месяцев. Я увидел, что моим бложиком пользуется 98% пользователей с винды. Ещё был процент с линукса, полтора с макоси, в общем, оказалось, что статистическая разбивка посетителей моего сайта повторяет статистическую разбивку пользователей всех остальных сайтов рунета. Точные цифры я выложил в ЖЖ (это было реально давно), но не суть.

Суть в том, что я офигел, заподозрил, что большинство линуксоидов, например, режут statcounter и выгрузил непосредственно логи апача.

Так вот, логи апача в целом подтверждали слова statcounter. По URL-ам было видно, что основную аудиторию моего сайта составляю не я и не мои друзья с линуксом, а спамеры, в UA которых стояла винда.

Вывод вдумчивый читатель сделает сам.

Aceler ★★★★★
()
Последнее исправление: Aceler (всего исправлений: 1)
Ответ на: комментарий от x22

Дело не в абсолютных числах

Речь же о статистике. Я не про абсолютные числа, а об уникальных парах (IP + ua), которыми они измеряются. Чем охват шире, тем ясней общая картина.

dmitry237 ★★★★
()
Ответ на: комментарий от Aceler

По URL-ам было видно, что основную аудиторию моего сайта составляю не я и не мои друзья с линуксом, а спамеры, в UA которых стояла винда.

Вон оно че, Михалычь (с) Впрочем, здесь явно делалась отсечка по ‘country: RU’. История успеха UA 2022-2024, скорее всего, не при делах.

x22 ★★
() автор топика
Ответ на: комментарий от dmitry237

Чем охват шире, тем ясней общая картина.

Разумеется.

Для этого нужен доступ к логам сайтов разной тематики, чтобы составить unbiased^Wсистематически несмещенную выборку.

x22 ★★
() автор топика
Ответ на: комментарий от Aceler

По URL-ам было видно, что основную аудиторию моего сайта составляю не я и не мои друзья с линуксом, а спамеры, в UA которых стояла винда.

Чтобы исключить спамеров/ботов, маскирующихся под живых юзеров, надо изучать последовательность связанных запросов. Тогда с какой-то эффективностью/процентом ложных можно повысить отношение сигнал/sqrt(фон).

Для этого статистики в 10000 уникальных «юзеров» может не хватить.

x22 ★★
() автор топика
Ответ на: комментарий от x22

Вот-вот. Причём в том же statcounter этим явно никто не занимается, зато мы теперь знаем, чем вызваны всплески по 10% — просто сеточки периодически меняют свои юзерагенты.

Aceler ★★★★★
()
Ответ на: комментарий от Aceler

зато мы теперь знаем, чем вызваны всплески по 10% — просто сеточки периодически меняют свои юзерагенты.

Надо исходить из того, что ботоводы не дураки, и u-a распределяют случайным образом в соответствии с распределением u-a для реальных юзеров (откуда его брать, если распределение u-a statcounter уже искажено ботами?)

There’re no people on the Internet (c)

x22 ★★
() автор топика
Ответ на: комментарий от x22

Впрочем, здесь явно делалась отсечка по ‘country: RU’. История успеха UA 2022-2024, скорее всего, не при делах

«UA» – это User Agent, а не страна, лапоть!

quwy
()

А самое интересное, что при замене all на desktop доля линукса… а вот и не угадали, растёт! Причём по миру в целом заметно сильнее, чем по России.

Импортозамещение, получается, не самый лучший стимул к освоению линукса. :)

hobbit ★★★★★
()
Ответ на: комментарий от hobbit

при замене all на desktop доля линукса… а вот и не угадали, растёт! Причём по миру в целом заметно сильнее, чем по России.

Буржуи умели считать деньги, когда linux.org.ru еще не существовал. Причем без всяких нормативных актов, кроме прайсов поставщиков и требований выполнить задачу при ограниченном сверху бюджете.

// Когда в середине 2000-х начал праздно интересоваться темой MS vs GNU/Linux, сидя на работе длинными вечерами, набрел на опубликованную в конце 90-х статью типа «x86/NT vs Linux? A computing platform for LHC …» (ссылки искать через 20 лет лень, так что оставляем упражнение читателям). Для обработки данных для тогда еще не построенного LHC вполне здраво предполагалось использовать не штучные суперкомпьютеры с дорогостоящими локальными хранилищами, а распределенный грид из ~10^6 коммерческих x86-машин (storage отдельный вопрос). Следующий вопрос был о выборе операционной системы и компилятора. В CERN сделали два одинаковых по железу кластера, один на x86/NT, второй на x86/Linux (возможно, сравнивали еще с чем-то, не застал системы, использовавшиеся в CERN до начала 2000-х). Портировали софт для Монте-карло, симуляции отклика гипотетического детектора и реконструкции событий. На одном и том же наборе задач сквозная производительность была сравнимой (авторы даже отметили, что перенести софт с Unix на NT не очень сложно, и NT неплохо утилизирует SMP). Но как это масштабируется на 10^6 CPU? Не помню, обсуждался ли в статье бюджет на лицензии/сопровождение. В итоге, уже в начале 2000-х вычислительной платформой для LHC Computing Grid был выбран RedHat Linux. Это естественно потянуло массовые десктопы на том же RedHat/SLC, чуть позже лаптопы у десятков тысяч причастных, включая пробегающих мимо студентов/PhD, и т.д. И это только один пример из узкой области. В других отраслях, не исключаю, было то же самое: добровольно и с песней на Linux по чисто экономическим причинам.

В РФ рынок вычислений примитивный, так что без жестких ограничений со стороны поставщиков коммерческого ПО миграция на Linux и opensource не пойдет.

x22 ★★
() автор топика

сключаем запросы из сетей, для которых по маске /16 whois не возвращает ‘country: RU’

Точно говорю что не всех посчитали. Сейчас посмотрел две сетки нашего офиса, обе не из RU по whois. Предваряя вопрос, пользуем уже лет 14.

anc ★★★★★
()
Ответ на: комментарий от anc

Это известно. Проверка по /24 упирается в лимит на обращения к whois в сутки. Можно менять whois-серверы и т.д. Вопрос, какой bias дает выбор по /16 с country RU.

x22 ★★
() автор топика
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)