LINUX.ORG.RU

LOR takeout

 , ,


0

1

Реквестирую отложенную генерацию архива сообщений пользователя (желательно в т. ч. удалённых) по запросу и его отправку на электронную почту.

Ответ на: комментарий от sluggard

щас придет эдик и расскажет как это посчитать на сях силами микроконтроллера.

SevikL ★★★★★
()
Ответ на: комментарий от Shaman007

Иметь локальную копию сообщений для быстрого поиска, в т. ч. оффлайн и в случае закрытия ЛОРа. Ну и использовать для дата-майнинга (хочу написать и обучить бота-попугая).

MiniRoboDancer ★☆
() автор топика

Я лучше решение знаю. В правилах сайта указать что пользователь передает все свои посты в собственность владельца сайта.

ieeya
()
Ответ на: комментарий от sluggard

Интересно, сколько займёт архив Эдика, у которого больше 80к сообщений.

Архив Эдика будет сжиматься по алгоритму Бабушкина, всё ок. Можно даже предварительно сжать все сообщения Эдика этим архиватором прямо в БД.

h578b1bde ★☆
()
Ответ на: комментарий от leave

Слово «вторая» было употреблено в значении «ещё одна», а не в порядковом. ВрИО К.О.

sluggard ★★★★★
()
Ответ на: комментарий от h578b1bde

Причём перед сжатием все сообщения Эдика нужно перекодировать в КОИ8-Р, тогда алгоритм Бабушкина будет работать оптимально. Я вообще предлагал весь ЛОР перевести на КОИ8-Р с внятной аргументацией профита, но всем, как всегда...

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от Pinkbyte

Может, некоторые не хотят регаться на жидхабе и присылают патчи Макскому на почту.

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от Pinkbyte

Чтоб ЛОР после этого с жопореза вообще не работал? Да ну вас нафиг.

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от MiniRoboDancer

На один день — профита особого не будет

А какой профит от этого, ну кроме троллинга всех кто не Эдик?

Да и слишком незаметно для первоапрельской шутки

Почему же, когда во всех постах (в т.ч. и в твоём) всякие тире и многоточия превратятся в крякозябры или ?? — вполне будет заметно. Да и «ёлки» отвалятся.

h578b1bde ★☆
()
Ответ на: комментарий от h578b1bde

А, ещё про всякие иконки прикреплённых, пингвинов, глаза Саурона и прочие звёздочки забыл, они же уже шрифтами рисуются.

h578b1bde ★☆
()
Ответ на: комментарий от h578b1bde

А какой профит от этого

Страницы сайта в основном состоят из текстового контента на русском языке, буквы которого в UTF-8 засовываются в два байта. Таким образом, переход на однобайтовую кодировку даст значительную экономию трафика, заметную даже при GZip-сжатии, и технически упростит соблюдение правила 4.8.

превратятся в крякозябры

Мусьё не слышал об HTML-сущностях?

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от MiniRoboDancer

А иконочным шрифтам вообще пофигу, на что мапиться.

Сейчас оно и без специальных шрифтов работает. Пруф:

MiniRoboDancer ★★ (13.06.2015 07:58:18)

h578b1bde ★☆
()
Ответ на: комментарий от MiniRoboDancer

Таким образом, переход на однобайтовую кодировку даст значительную экономию трафика, заметную даже при GZip-сжатии

В XXI веке экономить на спичках и вместо них разжигать огонь камнями не принято.

экономию
HTML-сущностях

/0

h578b1bde ★☆
()
Ответ на: комментарий от h578b1bde

на спичках

Ну-ну. Вот глагне ЛОРа.

-rw-r--r-- 1 bodqhrohro bodqhrohro 16670 Июн 13 15:38 9.gz
-rw-r--r-- 1 bodqhrohro bodqhrohro 10500 Июн 13 15:39 9.koi
-rw-r--r-- 1 bodqhrohro bodqhrohro  4854 Июн 13 15:40 9.koi.gz
-rw-r--r-- 1 root       root       59084 Янв 31  2014 9.txt
Тут четыре пачки спичек как минимум. А пихать во все поля UTF-8, патамушта «ко-ко-ко, универсальность», не нужно, <meta charset>--то не зря в HTML5 впилили. И кстати, один раздел в КОИ8-Р тут уже есть.

/0

Мусьё когда-нибудь задумывался, почему на QWERTY-клавиатурах заглавные буквы набираются с модификатором/переключателем, а не представлены отдельными клавишами? Тут тот же случай.

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от h578b1bde

Оно работает, если используется шрифт с вменяемой поддержкой хрюникода. А зайдёшь, например, с elinks из tty с каким-нибудь фикседсисом вместо шрифта, или с мобильника с одним системным шрифтом и без поддержки вебшрифтов — звёздочки превращаются в тыкву. Когда звёзды были картинками — там в alt был символ *, нормально отображающийся в любом текстовом браузере. Сейчас можно замапить на этот же символ звёзды — прогрессивные графикорабы получат вебшрифты, остальным будут кроссплатформенные снежинки, и копипастить можно будет так же, в отличие от картинок. Что касается пустых звёзд, то их можно замапить на какой-нибудь ноль или собаку — не так уж часто встречаются. И из всех иконок на ЛОРе замаплены на соответствующий хрюникодный символ только полные/пустые звёзды — у остальных таких соответствий нет.

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от MiniRoboDancer

16670

А я думал что диалап-модемы уже повсюду кроме музеев выкинули.

А пихать во все поля UTF-8, патамушта «ко-ко-ко, универсальность», не нужно

Кому не нужно?

<meta charset>--то не зря в HTML5 впилили. И кстати, один раздел в КОИ8-Р тут уже есть.

Легаси же.

Мусьё когда-нибудь задумывался, почему на QWERTY-клавиатурах заглавные буквы набираются с модификатором/переключателем, а не представлены отдельными клавишами?

Потому что человек не осьминог?

h578b1bde ★☆
()
Ответ на: комментарий от h578b1bde

Ладно, я мирдверьмяч, вот корректные данные:

-rw-r--r-- 1 bodqhrohro bodqhrohro 16670 Июн 13 15:38 9.gz
-rw-r--r-- 1 bodqhrohro bodqhrohro 48518 Июн 13 16:13 9.koi
-rw-r--r-- 1 bodqhrohro bodqhrohro 15471 Июн 13 16:13 9.koi.gz
-rw-r--r-- 1 root       root       59084 Янв 31  2014 9.txt
На пожатый трафик особого профита не даёт, но в БД комментарии непожатыми лежат, а проблема нехватки дискового пространства тут возникает регулярно, так что...

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от MiniRoboDancer

если используется шрифт с вменяемой поддержкой хрюникода

В каком нормальном шрифте сейчас нет хрюникода?

с elinks из tty с каким-нибудь фикседсисом вместо шрифта

Просто не нужно использовать всякое говно вместо шрифтов и костыли вместо браузера.

без поддержки вебшрифтов — звёздочки превращаются в тыкву

4.2 же.

прогрессивные графикорабы получат вебшрифты

Зачем мне вебшрифты если у меня и без них хорошо показывает?

остальным будут кроссплатформенные снежинки

Кроссплатформенные с другими экспонатами музея?

Что касается пустых звёзд, то их можно замапить на какой-нибудь ноль или собаку

= заменить нормальное решение на унылые костыли и подпорки.

h578b1bde ★☆
()
Ответ на: комментарий от h578b1bde

А я думал что диалап-модемы уже повсюду кроме музеев выкинули

Диалап, может, и выкинули, а вот UMTS в некоторых государствах ещё нескоро распространится хотя бы по крупным городам (да и там, где есть, он сейчас дороговат, даже у яйцеголовых). А пока нет UMTS и залупливают ещё более конские цены за EVDO — жив жопорез, который хоть теоретически и быстрее диалапа, особенно с ежом, но по стабильности САСАЙТ. Кстати, с диалапом можно на халяву подрубиться к абоненту в другом конце города (или с GSM к абоненту того же оператора) и переслать ему файл, а через эти ваши интернеты так можно? Есть ХСВ, да, но попробуй найти ХСВ не за NAT, чтоб не надо было юзать костыли для P2P.

Кому не нужно?

Здравомыслящим людям, которые задумываются, прежде чем выделить int под счётчик от 0 до 10, дабы не охать потом от пожирания гигабайтов памяти своим говнокодом.

Легаси же.

Такое легаси, что для него аж удобный короткий синтаксис запилили вместо простынь, которые так и остались для остальных <meta>, ага.

Потому что человек не осьминог?

Создателей Space Kadet, пультов для микширования и управления АЭС это как-то не останавливало.

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от MiniRoboDancer

16670-15471=1199 — одна спичка со скалкой от второй. Очевидно что HTML-сущности, картинки вместо глаз и прочий треш сожрёт больше.

в БД комментарии непожатыми лежат, а проблема нехватки дискового пространства тут возникает регулярно, так что...

…если из ЛОРа maxcom до сих пор ещё не сделал музей значит почистить мусор и добавить дисков таки проще.

h578b1bde ★☆
()
Ответ на: комментарий от h578b1bde

В каком нормальном шрифте сейчас нет хрюникода?

Я уже перечислил. Другие примеры ищите сами.

Просто не нужно использовать всякое говно вместо шрифтов и костыли вместо браузера.

Ну удачи восстанавливать систему с отвалившимися иксами и без лайвов.

Зачем мне вебшрифты если у меня и без них хорошо показывает?

Глаз, стрелку, ярлык, пингвина? Да ладно?

Кроссплатформенные с другими экспонатами музея?

С фашистским подходом никакая кроссплатформенность не нужна.

заменить нормальное решение на унылые костыли и подпорки

А не всё равно ли, что там отображается для обозначения прописянной звезды? Поиграйте в текстовые рогалики — отпустит.

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от h578b1bde

Очевидно что HTML-сущности

Пару шестибайтовых последовательностей сожрут больше килобайта? Много их не будет, потому что 4.8 запрещает иероглифы і всілякі інші незрозумілі російськомовним німцям символи.

картинки вместо глаз

Я предлагал возвращать картинки?

значит почистить мусор и добавить дисков таки проще

Макском уже слишком стар, чтобы бегать каждый раз и выискивать мусор, а дисков хостящемуся на халяву сайту охотно добавлять никто не будет.

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от MiniRoboDancer

Диалап, может, и выкинули, а вот UMTS в некоторых государствах ещё нескоро распространится хотя бы по крупным городам (да и там, где есть, он сейчас дороговат, даже у яйцеголовых). А пока нет UMTS и залупливают ещё более конские цены за EVDO — жив жопорез, который хоть теоретически и быстрее диалапа, особенно с ежом, но по стабильности САСАЙТ.

Это не проблема ЛОРа. У этих пользователей САСАЙТ будет всё.

Кстати, с диалапом можно на халяву подрубиться к абоненту в другом конце города (или с GSM к абоненту того же оператора)

А World Wide Web тут притом, что…

и переслать ему файл

С флешкой сбегать быстрее будет.

Здравомыслящим людям

Здравомыслящие люди в этих ваших интернетах используют UTF-8 вместо всякой местечковой музейной маргинальщины.

дабы не охать потом от пожирания гигабайтов памяти своим говнокодом

Не увидел в твоём эксперименте выше гигабайтов. Говнокодить можно и на ANSII и на KOI в каком-нибудь 1C.

Такое легаси, что для него аж удобный короткий синтаксис запилили вместо простынь, которые так и остались для остальных <meta>, ага.

Эти наркоманы и не такую траву употребляют, поэтому я даже не удивлён.

это как-то не останавливало

Почему же, можно и клавиатуру сделать в виде пульта управления АЭС. Вот только удобство в её практическом использовании сомнительно.

h578b1bde ★☆
()
Ответ на: комментарий от MiniRoboDancer

Пару шестибайтовых последовательностей сожрут больше килобайта?

Картинки ты конечно же проигнорировал.

4.8 запрещает иероглифы

Это хорошо, но для соблюдения норм 4.8 в предлагаемой тобой кодировке нет тире, ёлок и многоточий. К тому же, нормально создать тред в техразделе про удаление файлов с какими-нибудь иероглифами в имени с копипастой ls будет нельзя.

Я предлагал возвращать картинки?

Ок, как ты предлагаешь рисовать иконки прикреплённых, ответов, кастов и прочие глаза Саурона?

Макском уже слишком стар

Оскорбление администрации же, ну.

h578b1bde ★☆
()
Ответ на: комментарий от MiniRoboDancer

Я уже перечислил

Маргинальщина какая-то с полтора пользователями, ненужно.

Ну удачи восстанавливать систему с отвалившимися иксами и без лайвов.

У тебя каждый день иксы падают и сидюк не работает, а вместо интернетов диалап-модем? А ЛОР-то тут причём?

С фашистским подходом никакая кроссплатформенность не нужна.

Верно, поэтому фашисты со своей ССЗБ8-Р должны страдать.

А не всё равно ли, что там отображается для обозначения прописянной звезды?

A eshhjo mozhno pisat' translitom vmesto kirillicy, ved' kakaja raznica kak ono tam otobrazhaetsja. K tomu zhe, ispol'zuja tol'ko ANSII mozhno pozhat' BD eshhjo bol'she!

h578b1bde ★☆
()
Ответ на: комментарий от h578b1bde

У этих пользователей САСАЙТ будет всё

Практика показывает, что САСАЙТ лишь отдельные рукожопые поделия.

А World Wide Web тут притом, что…

А ни при чём. Дурная практика вообще всё пихать в сеть. Человечество захлестнула волна эксгибиционизма, которая уже начинает вылезать боком, а дальше будет только хуже — целое поколение без личной жизни и хоть капли своей мысли в голове.

С флешкой сбегать быстрее будет.

Это если время и возможность будет пешком пересекать город.

Здравомыслящие люди в этих ваших интернетах используют UTF-8 вместо всякой местечковой музейной маргинальщины.

Это всё равно что говорить, что здравомыслящие люди всё пишут на Java вместо всякой музейной маргинальщины. У каждой технологии есть своя ниша применения.

Не увидел в твоём эксперименте выше гигабайтов

60k запросов к глагне — вот и гигабайт наскрёбся. И это только к глагне.

Говнокодить можно и на ANSII и на KOI

Кодировки ни при чём, я привёл это как пример того, что бывает, если пихать одно и то же универсальное решение во все поля, проще говоря, не только забивать молотком гвозди, но и закручивать им шурупы, ощипывать куриц и использовать вместо рыболовного крючка.

Вот только удобство в её практическом использовании сомнительно.

Ну так и в чём состоит удобство использования переменнодлинной кодировки, выдающей два байта на русском тексте, когда хватит одного?

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от h578b1bde

Мы опять ходим по кругу?

нормально создать тред в техразделе про удаление файлов с какими-нибудь иероглифами в имени с копипастой ls будет нельзя

HTML-сущности.

как ты предлагаешь рисовать иконки прикреплённых, ответов, кастов и прочие глаза Саурона?

Как и сейчас — веб-шрифтами.

Оскорбление администрации же, ну.

Горькая правда лучше сладкой лжи.

MiniRoboDancer ★☆
() автор топика
Ответ на: комментарий от h578b1bde

с полтора пользователями

На среднестатистическом сайте — возможно, но не на ЛОРе.

каждый день

Пожары не каждый день случаются, так что теперь, огнетушители не держать?

фашисты со своей ССЗБ8-Р

При чём тут Эдик?

K tomu zhe, ispol'zuja tol'ko ANSII mozhno pozhat' BD eshhjo bol'she!

Movno, no gownoь86 ne umeet effektiwno rabotatx s new&rownenn&mi po 8-mi bitam dann&mi, tak ^to profit pri hranenii niweliruetsq poterej proizwoditelxnosti pri w&da^e. I ne obqzatelxno ANSII, w 7 bit i KOI-7 wlezaet.

MiniRoboDancer ★☆
() автор топика
Последнее исправление: MiniRoboDancer (всего исправлений: 1)
Ответ на: комментарий от MiniRoboDancer

На среднестатистическом сайте — возможно, но не на ЛОРе.

Пользователи ЛОРа автоматически становятся говноедами? Иначе как ещё объяснить такую тягу к каким-то кривым костылям при наличии нормальных работающих решений.

Пожары не каждый день случаются, так что теперь, огнетушители не держать?

Таки кто тебе мешает держать диски с лайвами?

При чём тут Эдик?

А при чём тут Эдик? Я имел в виду фашистов, которые „два алфавита и полтора спецсимвола хватит всем”. Хотя да, получилось тонко.

h578b1bde ★☆
()
Ответ на: комментарий от MiniRoboDancer

Практика показывает, что САСАЙТ лишь отдельные рукожопые поделия.

Ок. А юникод тут причём?

Дурная практика вообще всё пихать в сеть.

А кто тебя заставляет пихать всё „в сеть”? Подними локальный FTP/SFTP/SCP с авторизацией и заливай что хочешь.

Человечество захлестнула волна эксгибиционизма, которая уже начинает вылезать боком, а дальше будет только хуже — целое поколение без личной жизни и хоть капли своей мысли в голове.

А виной всему этому конечно же хрюникод.

У каждой технологии есть своя ниша применения.

Верно, и ниша КОИ8-Р сейчас находится в музее где-то рядом с палкой-копалкой.

Кодировки ни при чём, я привёл это как пример того, что бывает, если пихать одно и то же универсальное решение во все поля, проще говоря, не только забивать молотком гвозди

И вместо забивания гвоздей молотком ты предлагаешь делать это камнями. Можно, конечно, но не нужно.

Ну так и в чём состоит удобство

В отсутствии ущербных ограничений из прошлого века.

60k запросов к глагне — вот и гигабайт наскрёбся. И это только к глагне.
переменнодлинной кодировки, выдающей два байта на русском тексте

Не вижу реальной проблемы.

когда хватит одного

Так ведь не хватит. Или ты покажешь где в предлагаемой тобой кодировке находятся тире, многоточие и ёлки? Если дело только в этом — сразу мог бы предложить более адекватную и полную кодировку, например cp1251.

h578b1bde ★☆
()
Ответ на: комментарий от MiniRoboDancer

HTML-сущности.

Это лишь вывод. Как ты собираешься без использования юникода ловить иероглифы от пользователя при добавлении поста?

h578b1bde ★☆
()
Ответ на: комментарий от MiniRoboDancer

прежде чем выделить int под счётчик от 0 до 10

Я вроде где-то слышал, что на некоторых (вполне возможно в том числе и x86) платформах наиболее быстро выполняются команды работы с переменными соответствующими разрядности процессора или кратные ей (например, на x86_64 такими будут 32-битные и 64-битные, а вот 16-битные и 8-битные инструкции будут тормозить, на x86 оптимальный размер переменной лишь один - 32 бита, на всяких ARM не знаю, но подозреваю, что тоже 32 бита). И уж точно быстрее выполняются обращения к выровненным данным. В свете этой информации int вполне может оказаться быстрее char, если у тебя не 8-битный процессор. А в оптимизации по скорости нет ничего зазорного на ПК, это только под микроконтроллеры компилируют с -Os.

Кстати, насчёт тормозов инструкций не той разрядности вполне есть пруф. Команды, работающие с 16-разрядными переменными на x86, кодируются с помощью специального префикса, а 32-разрядные - без него. Как следствие, процессор парсит команду дольше из-за этого самого лишнего байта префикса. И код получается жирнее из-за этих самых префиксов.

То есть сэкономив 2 байта и сделав 16-битную переменную вместо 32-битной на x86 ты потеряешь по байту на каждом обращении к ней (а обращаются к переменной как правило больше одного раза), а также немного скорости. Стоит ли игра свеч?

Зато стандарт более-менее гарантирует, что int будет иметь оптимальный размер для данной платформы (разве что на всяких восьмибитных микроконтроллерах int превышает размер машинного слова и поэтому char даст выигрыш), поэтому вполне разумно пихать его везде, где нет иных причин выбрать другой тип (для строки, а не одиночной переменной char уже даст очень заметный выигрыш в размере, поэтому стоит выбрать таки его, где-то int мало и надо long long).

KivApple ★★★★★
()
Последнее исправление: KivApple (всего исправлений: 8)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.