LINUX.ORG.RU

MDD: ​​В Manjaro Linux планируется введение телеметрии

 , ,


1

1

Команда Manjaro Linux начала тестирование сервиса MDD (Manjaro Data Donor) для сбора данных о пользователях и отправки их на внешний сервер проекта.

Изначально планировалось, что эта функция будет включена по умолчанию, но это решение столкнулось с возражением других мейнтейнеров проекта. По информации на данный момент, телеметрия появится в виде опции, требующей согласия пользователя при первом запуске ОС.

Телеметрия будет собирать имя хоста, версию ядра, версии компонентов рабочего стола, подробную информацию об оборудовании и задействованных драйверах, сведения о размере и разрешении экрана, MAC-адреса сетевых устройств, серийные номера дисков, данные о дисковых разделах, информацию о количестве запущенных процессов и установленных пакетов, версии базовых пакетов, таких как systemd, gcc, bash и PipeWire.

Решение MDD написано на языке Python и вызывает утилиту inxi с параметрами "-Fxxx" для получения полного отчёта с информацией о системе. Для безопасности клиентов IP-адреса пользователей в сборке статистики не сохраняются, а в качестве идентификатора каждой системы используется хэш от содержимого файла /etc/machine-id.

>>> Подробности



Проверено: hobbit ()
Последнее исправление: hobbit (всего исправлений: 2)

А зачем? Телеметрия нужна в двух случаях: когда нужно знать, как используют твой продукт, чтобы оптимизировать затраты и выставить приоритеты в разработке, или когда ты хочешь продать своих юзеров бигкорпам. Что конкретно манджаро собрались оптимизировать?

liksys ★★★★
()
Ответ на: комментарий от liksys

А зачем?

Чтобы узнать кто эти 2 с половиной маргинала, которые выбрали бубунту от мира arch

Kolins ★★★★★
()
Ответ на: комментарий от liksys

я здесь чтобы жевать жевачку и продавать твои данные, и жевачка у меня уже закончилась

PhD
()
Ответ на: комментарий от liksys

когда нужно знать, как используют твой продукт, чтобы оптимизировать затраты и выставить приоритеты в разработке

Для этого телеметрия не нужна. Достаточно статистики закачек образов дистрибьютива и пакетов, что легко делается на стороне хоста.

TechnoMag ★★
()
Ответ на: комментарий от TechnoMag

Достаточно статистики закачек образов дистрибьютива

Я скачал образы дебиана, суси, арча, федоры и центося. Опираясь на эту информация, скажи мне, что из них установлено на виртуалку, что - на железо, и что не установлено вообще.

и пакетов

Я скачал наборы пакетов гнома, кед и крысы. Опираясь на эту информацию, скажи мне, что я оставил и пользуюсь, а что снес немедленно, возможно заодно с системой.

thesis ★★★★★
()
Ответ на: комментарий от TechnoMag

Пакетом можно только один раз воспользоваться. Дальше он будет просто балластом.

Ещё для rolling есть проблема с частичным обновлением. И поэтому лучше обновлять сразу всё. Включая балласт.

Статистика хоста даёт картину. Но точность у телеметрии выше.

Нужна ли такая точность – это вопрос.

thegoldone ★★
()
Последнее исправление: thegoldone (всего исправлений: 2)
Ответ на: комментарий от thesis

Все это не так важно. Важно, что ты этим дистрибьютивом поинтересовался, в той или иной мере.

Вообще не понятно, зачем сейчас эта телеметрия, если на форуме Manjaro полно постов с детскими проблемами, которых давно в том же Mint давно нет. Пусть с форумов собирают, там и технические характеристики железа выкладывают, и версию ядра, и установленные пакеты и т.д.

З.Ы. Почему-то количество закачек некоторго софта и систем даже в новостях пишут, с графиками.

TechnoMag ★★
()
Последнее исправление: TechnoMag (всего исправлений: 1)
Ответ на: комментарий от TechnoMag

Это для дистра. Для других продуктов могут быть интересны какие-нибудь конфиги, например. Но не в таких деталях, как хотят в манжаре. Зачем им хостнейм? Вместе с хешем от machine-id это почти однозначно идентифицирует юзера.

liksys ★★★★
()
Ответ на: комментарий от TechnoMag

И вот теперь смотри, на описание задачи «…нужно знать, как используют твой продукт, чтобы оптимизировать затраты и выставить приоритеты в разработке» ты выдвигаешь решение, позволяющее понять, что «ты этим дистрибутивом интересовался в той или иной мере».

Богатое решение, всеобъемлющее.

thesis ★★★★★
()
Ответ на: комментарий от liksys

Но не в таких деталях, как хотят в манжаре.

Да что с вами не так? Чукча не читатель?

Вон я выше скопипастил собираемые данные. Идентифицируй-ка меня

Один клоун, открыл исходник, скопипастил с 40й строчки «inx -Fxxx», закрыл его и сразу же принялся ныть и причитать, совершенно «не заметив» что этот вывод парсится на следующих 800 строках.

И ни сеть, ни серийники ни тем более хостнейм туда не попадают.

https://github.com/manjaro/mdd/blob/master/mdd.py

hargard ★★
()
Последнее исправление: hargard (всего исправлений: 1)
Ответ на: комментарий от hargard

И ни сеть, ни серийники ни тем более хостнейм туда не попадают.

Да что ты говоришь!

Во-первых, там есть device_id, по которому можно понять, что это за машина, он вычисляется как sha256->uuid от /etc/machine-id и позволяет в принципе сопоставить репорт и понять, что он именно от твоей машины. Во-вторых, там есть точная модель твоего железа, которая может опять же идентифицировать конкретный хост.

liksys ★★★★
()
Ответ на: комментарий от liksys

Сначала оптимизировать, потом продать.

seiken ★★★★★
()
Ответ на: комментарий от liksys

Во-первых, там есть device_id

Ну-с пан хакер, покажете класс?

 "device_id": "4c069383-f016-5412-9726-a23168842326", 

Жду мой мой machine-id

Во-вторых, там есть точная модель твоего железа

Конкретика конечно же будет?

сопоставить репорт и понять, что он именно от твоей машины

Да неужели? Вот так вот взять один device_id и ограничить его одним mdd-репортом?

hargard ★★
()
Ответ на: комментарий от hargard

Жду мой мой machine-id

Ты читать не умеешь. Я сказал, что можно идентифицировать твою машину, а не определить твой machine-id.

Конкретика конечно же будет?

Конечно же, будет. Я же не ты, а скачал, посмотрел и запустил:

$ python mdd.py | grep -E "board|model|product"
        "product_name": "20VX006HRT",
        "product_family": "ThinkPad P14s Gen 2i",
        "board_name": "20VX006HRT"
        "model": "11th Gen Intel Core i7-1165G7",
                "model": "Intel TigerLake-LP GT2 [Iris Xe Graphics]",
                "model": "NVIDIA TU117GLM [Quadro T500 Mobile]",
                "model": "BOE Display 0x07db",
         'model': '11th Gen Intel Core i7-1165G7',
                        'model': 'Intel TigerLake-LP GT2 [Iris Xe Graphics]',
                        'model': 'NVIDIA TU117GLM [Quadro T500 Mobile]',
                           'model': 'BOE Display 0x07db',
 'system': {'board_name': '20VX006HRT',
            'product_family': 'ThinkPad P14s Gen 2i',
            'product_name': '20VX006HRT',

А теперь я жду извинений за твое хамство.

Да неужели? Вот так вот взять один device_id и ограничить его одним mdd-репортом?

Удивительно, но для этого айдишники и созданы. И даже без айдишников можно просто агрегировать данные. Ты как будто первый раз сегодня в интернет вышел и не знаешь, как бигдата работает.

liksys ★★★★
()
Последнее исправление: liksys (всего исправлений: 4)
Ответ на: комментарий от liksys

макадреса и серийники конечно нужны для такого анализа. без них никак

nempyxa ★★
()
Ответ на: комментарий от Kolins

Ну бубунту хотя бы работает нормально.

alll81 ★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.