LINUX.ORG.RU
ФорумTalks

Импортозамещение и процент Linux на десктопах

 , , ,


0

1

На тему наблюдаемости внедрения Linux в РФ.

Далее на типа серьезных щщах:

Процент Linux на пользовательских устройствах может быть оценен по относительной частоте встречаемости уникальных пар (IP, user-agent) при доступе к веб-серверам. Статистика собирается, например, statcounter.com по описанной ими методике. Из описания методики неясно, на каком именно наборе сайтов набирается статистика, как именно ОС распознается по user-agent, и как оценивается систематическая неопределенность измерений. На наличие у statcounter.com неконтролируемых систематических неопределенностей указывают, в частности, выходящие за рамки статистических флуктуаций колебания доли Linux в РФ от ~2% до 8-10% в 2021 г. (https://ibb.co/587zdr0).

Можно ли наблюдать статистически значимый эффект импортозамещения/внедрения Linux в РФ по относительной частоте (IP, user-agent)?

Оценки источников типа statcounter.com имеют неконтролируемую систематику, поэтому делаем независимую оценку по логам httpd, до которых добрались под Новый год (с помощью откликнувшихся товарищей) grep-ом:

cайт на русском языке, не технический, тематика биология/медицина; материал, в основном, популярный; посещаемость очевидна из статистических ошибок ниже.

Исключаем запросы из сетей, для которых по маске /16 whois не возвращает ‘country: RU’; исключаем оставшихся распространенных ботов (yandex.*bot|bot/|crawler|rowler|…); оставляем набор пар (IP, user-agent); идущие подряд одинаковые пары (IP, user-agent) заменяем на одну; подсчитываем частоту встречаемости user-agent по шаблонам ниже в процентах, приводим статистические ошибки:

                : 11-19 Dec 2022 : 05-15 Dec 2024 
--------------------------------------------------
Windows         : 49.7 +- 1.0    : 32.9 +- 1.4    
Android         : 24.4 +- 0.6    : 17.2 +- 0.9    
iPhone          : 17.1 +- 0.5    : 32.5 +- 1.4    
OS X            :  2.7 +- 0.2    :  5.9 +- 0.5    
Linux X11       :  0.7 +- 0.1    :  3.4 +- 0.4  *
Linux non-X11   : 0.01 +- 0.01   :  0.4 +- 0.1  * 
X11 non-Linux   : 0.08 +- 0.03   : 0.04 +- 0.04   
Mobile Safari   :  0.7 +- 0.1    :  0.6 +- 0.2    
Others          :  4.9 +- 0.3    :  7.9 +- 0.6    
--------------------------------------------------

Видно, что с середины декабря 2022 г. по середину декабря 2024 г. процент Linux/X11 статистически значимо возрос c 0.7+-0.1 до 3.4+-0.4. Виден также рост Linux не-X11 (не включает Android) – это сигнатура браузеров, работающих поверх Wayland?

Если есть желающие воспроизвести это независимо на доступных логах apache, короткий скрипт могу положить сюда.

★★

Linux не-X11 (не включает Android) – это сигнатура браузеров, работающих поверх Wayland?

Насколько я помню, андроиды тоже пишут Linux+X11 в юзер-агенте. И вайландобраузеры тоже. Ну, может не все, но некоторые. Так что наличие/отсутствие X11 можно не учитывать.

firkax ★★★★★
()
Ответ на: комментарий от firkax

Насколько я помню, андроиды тоже пишут Linux+X11 в юзер-агенте.

Добавил grep -vi android перед проверкой на Linux/X11. Проценты Linux + X11 не поменялись в пределах ошибок.

x22 ★★
() автор топика

По твоей статистике вдвое выросли количества iPhone и OS X. Нормальное такое «импортозамещение».

Tigger ★★★★★
()
Ответ на: комментарий от Tigger

А Windows уменьшилась в полтора раза. Круговорот гомна в природе.

Смотрите на Linux, которое не Android.

x22 ★★
() автор топика

это сигнатура браузеров, работающих поверх Wayland?

Насчёт остальных не скажу, но Огнелис под Wayland пишет про X11:

Mozilla/5.0 (X11; Linux x86_64; rv:133.0) Gecko/20100101 Firefox/133.0

QsUPt7S ★★
()
Ответ на: комментарий от Tigger

Так «импортозамещение» это не про хомяков.

anc ★★★★★
()

cайт на русском языке, не технический, тематика биология/медицина; материал, в основном, популярный

Описание источника получения данных выглядит сомнительно.

dmitry237 ★★★★
()

Рост есть, потенциал есть, вопрос, какой процент на десктопах в России может занять линукс? Ясно, что не 100%

tiinn ★★★★★
()

Я не думаю, что кто-то из домашних пользователей перешел на Линукс из-за какого-то там «импортозамещения».

MoldAndLimeHoney
()

Виден также рост Linux не-X11 (не включает Android) – это сигнатура браузеров, работающих поверх Wayland?

Не, на Wayland как минимум огнелис всё равно X11 пишет в юзерагенте. Вот у меня такой сейчас: Mozilla/5.0 (X11; Linux x86_64; rv:133.0) Gecko/20100101 Firefox/133.0. На вяленом.

CrX ★★★★★
()
Ответ на: комментарий от MoldAndLimeHoney

А в статистике только домашние пользователи? Тогда никакой особой разницы видно не должно быть. Ведь действительно, менять рабочий десктоп на гномовское недоразумение никто не будет. Вот кстати аккурат перед НГ говорил с родственником на счёт нового ноута. У него из спец прог только R, но датасеты очень маленькие. Привык к макбуку. Хотел взять ноут на винде за 500евро. Я ему, разумеется, сказал, что у макбука (даже самого дешёвого) и клава и время батареи не в пример будет лучше оных ноута за 500е. Линукс вообще не рассматривался, потому что человеку надо для работы, а не красноглазых экспериментов.

seiken ★★★★★
()
Последнее исправление: seiken (всего исправлений: 2)
Ответ на: комментарий от CrX

Не, на Wayland как минимум огнелис всё равно X11 пишет в юзерагенте

Значит, рост Wayland так не отловишь.

Сумма Linux X11 и Linux не-X11 (после исключения Android) выросла так или иначе.

Конечно, это может отражать изменение аудитории конкретного сайта за 2 года по внешним причинам.

x22 ★★
() автор топика
Ответ на: комментарий от dmitry237

Описание источника получения данных выглядит сомнительно.

Ссылку не пишу принципиально. Мопед не мой.

x22 ★★
() автор топика
Ответ на: комментарий от seiken

А в статистике только домашние пользователи?

В данном случае могут быть школьнеги/студенты.

Что творится во всяких МОУ, можно только гадать.

x22 ★★
() автор топика
Ответ на: комментарий от x22

Т.е. исходя из разряда процентов и из того, что:

посещаемость очевидна из статистических ошибок

то речь идет о 10 тыс. посещений за 10 дней? 365 тыс. уникальных посещений в год, можно ли это назвать достаточным для выводов? Ну наверное с натяжкой.

dmitry237 ★★★★
()
Ответ на: комментарий от dmitry237

то речь идет о 10 тыс. посещений за 10 дней?

При относительной стат. ошибке ~1% число уникальных пар (IP, u-a) ~10^4.

365 тыс. уникальных посещений в год, можно ли это назвать достаточным для выводов?

Дело не в абсолютных числах, а в на сколько сигм отличаются доля Linux в 2022 и 2024. Между 0.7+-0.1 и 3.4+-0.4 больше 5 сигм. Вероятность того, что это два измерения одной и той же (то есть с фиксированным распределением) случайной величины меньше 10^-6.

Значит, прОцент линукса изменился систематически.

Это не значит, что абсолютное число юзеров с линуксом выросло. Статистически значимо вымерли виндузятнеги, например.

x22 ★★
() автор топика

если исходить из вашей статистики, то Windows в основном замещали ай-фонами и маками :-)

MKuznetsov ★★★★★
()
Ответ на: комментарий от MKuznetsov

Windows + iPhone ~ константа. Возможно, аудитория молодеет.

Важно то, что меняется относительная доля обычного линукса.

// Предполагаю, что если взять распределение в новогодние праздники, то доля Linux X11 (не андроид) взлетит в разы.

x22 ★★
() автор топика

Когда-то давным-давно у меня был бложик на вордпрессе, куда ходил я, мои друзья-линуксоиды и ещё друзья-нелинуксоиды.

Ещё у меня там был прикол, что поскольку дизайн бложика криво показывался в IE (это было реально давно), то для IE я сделал отдельную примитивную версию. IE был уже на излёте, пользователей было мало.

И вот однажды я решил статистику проверить, а много ли вообще людей получают IE-only версию бложика, много ли людей пользуются IE. Может, выкинуть всё это страхомудие? Для этого я водрузил на сайт счётчик statcounter и сел в засаду выжидать.

Ну и что я увидел через пару месяцев. Я увидел, что моим бложиком пользуется 98% пользователей с винды. Ещё был процент с линукса, полтора с макоси, в общем, оказалось, что статистическая разбивка посетителей моего сайта повторяет статистическую разбивку пользователей всех остальных сайтов рунета. Точные цифры я выложил в ЖЖ (это было реально давно), но не суть.

Суть в том, что я офигел, заподозрил, что большинство линуксоидов, например, режут statcounter и выгрузил непосредственно логи апача.

Так вот, логи апача в целом подтверждали слова statcounter. По URL-ам было видно, что основную аудиторию моего сайта составляю не я и не мои друзья с линуксом, а спамеры, в UA которых стояла винда.

Вывод вдумчивый читатель сделает сам.

Aceler ★★★★★
()
Последнее исправление: Aceler (всего исправлений: 1)
Ответ на: комментарий от x22

Дело не в абсолютных числах

Речь же о статистике. Я не про абсолютные числа, а об уникальных парах (IP + ua), которыми они измеряются. Чем охват шире, тем ясней общая картина.

dmitry237 ★★★★
()
Ответ на: комментарий от Aceler

По URL-ам было видно, что основную аудиторию моего сайта составляю не я и не мои друзья с линуксом, а спамеры, в UA которых стояла винда.

Вон оно че, Михалычь (с) Впрочем, здесь явно делалась отсечка по ‘country: RU’. История успеха UA 2022-2024, скорее всего, не при делах.

x22 ★★
() автор топика
Ответ на: комментарий от dmitry237

Чем охват шире, тем ясней общая картина.

Разумеется.

Для этого нужен доступ к логам сайтов разной тематики, чтобы составить unbiased^Wсистематически несмещенную выборку.

x22 ★★
() автор топика
Ответ на: комментарий от Aceler

По URL-ам было видно, что основную аудиторию моего сайта составляю не я и не мои друзья с линуксом, а спамеры, в UA которых стояла винда.

Чтобы исключить спамеров/ботов, маскирующихся под живых юзеров, надо изучать последовательность связанных запросов. Тогда с какой-то эффективностью/процентом ложных можно повысить отношение сигнал/sqrt(фон).

Для этого статистики в 10000 уникальных «юзеров» может не хватить.

x22 ★★
() автор топика
Ответ на: комментарий от x22

Вот-вот. Причём в том же statcounter этим явно никто не занимается, зато мы теперь знаем, чем вызваны всплески по 10% — просто сеточки периодически меняют свои юзерагенты.

Aceler ★★★★★
()
Ответ на: комментарий от Aceler

зато мы теперь знаем, чем вызваны всплески по 10% — просто сеточки периодически меняют свои юзерагенты.

Надо исходить из того, что ботоводы не дураки, и u-a распределяют случайным образом в соответствии с распределением u-a для реальных юзеров (откуда его брать, если распределение u-a statcounter уже искажено ботами?)

There’re no people on the Internet (c)

x22 ★★
() автор топика
Ответ на: комментарий от x22

Впрочем, здесь явно делалась отсечка по ‘country: RU’. История успеха UA 2022-2024, скорее всего, не при делах

«UA» – это User Agent, а не страна, лапоть!

quwy
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)