LINUX.ORG.RU

Предлагается метод отделения персональной информации в Интернете от всей остальной и соответственно простой протокол


0

0

http://siberean.livejournal.com/4317.html

На самом деле я всегда удивляюсь - почему это до сих пор не придумали и браузеры не имеют чекбокса: "Public"/"Personal"

Комментарии велкам.

На самом деле я всегда удивляюсь - почему это до сих пор не придумали и браузеры не имеют чекбокса: "персонал,
где по нажатию "Personal" - человек соберёт всю свою персональную информацию (постинги) - со всего интернета (и только своё).

Я в процессе посылки RFC.

Предлагается метод отделения персональной информации в Интернете от всей остальной и соответственно простой протокол

Говорил пока со знающими людьми, правда проприетарщиками: говорят - надо.
Но я не хочу отдавать это проприетарщикам.

Написать комманд-лайн утилиту на C (мд5+base64enc) - несколько вечеров. Надо только устаканить протокол и что ещё будет полезно в будущем (в какую сторону раширять) вообще.

сорри за повторные копипасты одних и тех-же предложений из транслита

siberean
() автор топика

можно также плагин в мозиллу написать, но скорее всего - проще будет сёрч-енджинам - добавить чекбокс и добавлять NID в запрос - перед каждым кейвордом.

siberean
() автор топика

также сорри за английский/стиль в черновике - писал ночью всего за пару часов (ночью можно много чего написать ;)
Над стилем и хорошим английским уже работают :)

siberean
() автор топика
Ответ на: комментарий от ist76

Вы по линку читали?
(могу попробовать здесь изложить также и на русском - если надо, но по линку - там основная идея уже изложена)

siberean
() автор топика

> почему это до сих пор не придумали и браузеры не имеют чекбокса: "Public"/"Personal"

в гуглохроме есть фича "анонимный браузинг". оно, не?

isden ★★★★★
()
Ответ на: комментарий от ist76

Если в кратце - практический метод сделать поиск в интернете - только над своими постингами, своей информацией, не получая миллионов результатов других.

Чекнув checkbox "Private" (или "Моё") и набрав в браузере "кризис" - я получу не все документы где встречается слово "кризис" (миллионы-миллиарды), а только все _свои_ постинги (в фейсбук, ЖЖ, ЛОР), которые я когда-либо делал и к которым приаттачил кейворд "кризис" (как метка). Или сделав запрос со своим NID - я смогу получить всю информацию - которую я когда-либо постил. И даже если УРЛы, domainnames поменялись - я их (постинги) тем не менее получу. И даже если кто-то скопипастил/замиррорил мою мессагу (не убрав подпись - NID) - я её тоже получу как результат простого запроса.

Т.е. это метод разделения информации в интернете на 2 группы: мою частную и всю остальную - в простейшем случае, и любое количество групп (по кейвордам) - в более сложных.

siberean
() автор топика
Ответ на: комментарий от siberean

>Вы по линку читали?

Во-первых, это ЛОР. Здесь не принято ходить по ссылкам)
Во-вторых, мне бы вкратце, (вкратце - это один абзац, а не два экрана) и на нативном языке. Все-таки, здесь не все из Торонтовки, а напрягать англоговорящую мышцу головного мозга без серьезной на то причины после окончания рабочего дня как-то влом.

ist76 ★★★★★
()
Ответ на: комментарий от isden

> оно, не?

слышится как совсем другое

Для экстракции всей моей информации - должен быть какой-то уникальный ключ типа подписи (я назвал его НИД) - на всех постингах.
Для поддержки многих групп - нужен протокольчик, в простейшем случае - типа приаттачивание кейворда к НИД (и так - для каждой метки).
Если это будет (удобный интерфейс) - можно использовать интернет как глобальный сторедж, "облако" отовсюду и так же легко собирать информацию - простыми запросами.

siberean
() автор топика
Ответ на: комментарий от siberean

Ага, спасибо, теперь понятно.
Честно сказать, никогда не ощущал у себя потребности в такой штуке.
А вот можно тоже самое, но чтобы искать не в своей частной информации, а в чьей-нибудь еще? Например, если мне интересно все, что думает про кризис знаменитый экономист Степа Жопкин. Как-то так можно?

ist76 ★★★★★
()
Ответ на: комментарий от ist76

я попробую попозже перевести на русский.

Представьте: вы постите все свои мессаги с уникальным стрингом (коротким, типа XQgYnkgYSBwZXJzZXZlcm) на все ресурсы и форумы. Это ваш персональный ключ который вы можете перегенирировать (но тогда не найдёте первую группу:) и который генерируется от вашего имени, года рождения, вашего пароля и который можно считать уникальным на всём белом свете.

Попробуйте погуглить на стринг "XQgYnkSBwZXZXZlcm" и вы получите мою статью по ссылке (и ничего более:).
Потому что вероятность что у кого-то такое-же имя, такой же день рождения и "салт" (какбы пароль) - "мой кот кузя" - почти нуль.
Аттачя этот стринг ко всем своим мессагам - я могу легко собрать все свои постинги.

Теперь второе расширение: аттача кейворды к NIDу - я могу группировать свою дату. Итд.
Единый протокол формирования NIDа - уменьшит вероятность коллизий - если кто-то будет давать слишком простой ввод для генерации хэша.

siberean
() автор топика
Ответ на: комментарий от ist76

Тогда надо узнать у Степы Жопкина его NID, и если он даст (можно придумать ещё разные подписи Стёпы: для себя, для друзей, для публики) публичный NID - конечно. Но это его, Стёпы, прерогатива - сохранять с НИДом (и.е. to make it easy searchable) или нет.
А из-за принципиального свойства необратимости хэш-функции - вы без желания Стёпы - не узнаете его постингов, конечно.

siberean
() автор топика
Ответ на: комментарий от siberean

сорри, гуглить надо по "XQgYnkgYSBwZXJzZXZlcm"

siberean
() автор топика
Ответ на: комментарий от siberean

А вот прикручивается вся эта функциональность поверх имеющейся инфраструктуры или придется пол-интернета перелопачивать?

ist76 ★★★★★
()
Ответ на: комментарий от ist76

ничего не надо перелопачивать.
Вы можете это уже сейчас использовать - придумав какой-то необычный стринг - без всяких дополнительных программ.

Но чтобы не было бардака, мусора и коллизий - я предлагаю отработать протокол, описанный в черновике к RFC.
И на базе его - добавить плагины в мозиллу и комманд-лайн утилиту (я её напишу быстро) - чтобы прозрачно этим пользоваться.

siberean
() автор топика

Перенесите уже в талксы с жесткой модерацией

Sweetheart
()
Ответ на: комментарий от siberean

прикиньте - по запросу "фото" в гугле (имея чекнутый чекбокс) - вы получите все свои публичные фотки, когда либо опубликованные, и только.
Это позволяет иметь частный интернет, пользуясь общими ресурсами.
Что это как не сохранения "в облаке", "облачные вычисления". О последних можно будет поговорить позже, когда можно и код иметь на удалюнных серверах и запускать тот код - над только своей датой, легко находимой по NIDу.

siberean
() автор топика
Ответ на: комментарий от gkrellm

> Думаю проще всего иметь оригинальный ник и гуглить его на здоровье.

будут коллизии и неочевидно для масс (как аттачить кейворды к тому нику и почему постить ник несколько раз). Плагин/прога (на основе фиксированного протокола) - скроет детали и сделает пользование удобным.

siberean
() автор топика

Так это не браузеры нужно править, тут нужно, чтобы гугл эту хрень индексировал. Боюсь, что гуглу этот RFC до лампочки будет.

alexru ★★★★
()
Ответ на: комментарий от alexru

Сорри, по ссылке не ходил. Перечитал появившиеся посты - понял, работать может и будет. Но усилий потребуется уйма на превращение идеи в массовую. Проще итметь уникальный ник.

alexru ★★★★
()
Ответ на: комментарий от siberean

вот этот конкретный пост - скоро можно будет найти простым поиском в гугле (когда он заиндексирует):
"NID, LOR"

(что приаттачит плагин браузера - понятно?)


-----------------------------------------------------------------------
XQgYnkgYSBwZXJzZXZlcmNID XQgYnkgYSBwZXJzZXZlcmpLOR

siberean
() автор топика
Ответ на: комментарий от alexru

гугл индексирует все токены без исключения и так. И НИД - не исключение из правил. Всё уже давно работает - кроме методологии и практики изолирования "своего" веба от "чужого". Стандард позволит не иметь большого бардака.
(я и сейчас этим пользуюсь - как и юзера очень редких ников, которые правда не могут группировать свою информацию в подгруппы - что тоже предлагается)

siberean
() автор топика
Ответ на: комментарий от siberean

Вот этот вот аттач - он красоты явно не добавляет, а для администрации многих ресурсов (особенно для тех, кто не в курсе нового RFC) будет выглядеть как мусор и (предрекаю) станет поводом для удаления постов.

ist76 ★★★★★
()
Ответ на: комментарий от ist76

В целом, извините, на ум приходит слово "костыль" - кому-то полезный, но все-равно остающийся таковым

ist76 ★★★★★
()
Ответ на: комментарий от ist76

но вы только подумайте - какие возможности - для каждого человека лично!

22 чара на кейворд - это имхо немного. (А для чего вообще интернет работает как не для людей?)

представьте - как вы простыми запросами - как дирижёр палочкой - манипулируете всей значимой для вас информацией.

Адрес Пети - на рапиде, адрес Васи - на ЖЖ (или одноклассниках - уже не помните). Делаете запрос "адрес" - получаете свою записную книжку со всего интернета!

siberean
() автор топика
Ответ на: комментарий от ist76

> В целом, извините, на ум приходит слово "костыль" - кому-то полезный, но все-равно остающийся таковым

иначе эту функциональность имхо сделать нельзя. Все другие способы будут более дорогие (либо завязаны на централизацию и меньшее прайваси - как пасспорты там всякие, ЮИДы и прочее, т.е. ставящие всех - под одну гребёнку). Здесь - открытый и простой протокол, конвенция даже. И всё уже работает, главное.

Хотя я уважаю ваше мнение. Но не согласен.

siberean
() автор топика
Ответ на: комментарий от ist76

работает для меня лично, но пока - не для других.

Так же как и ассоциативный сервис, который я поддерживаю для себя много лет и по сохранению какого-то файла в файлопомойку - делаю:
$echo "/storage/20090618/dira" >> $INDEX/photo
$echo "/storage/20090618/dira" >> $INDEX/vocation


а потом - по прошествии многих лет - делаю запрос в индех на предмет "photo vocation" и получаю интерсект 2х групп как результат. Т.е. фактически имея свой персональный Гугл.
И имея возможность всё быстро найти в терабайтах.
Но так как костылей много - другие вряд-ли будут использовать то-же (только если проникнутся и имели проблемы поддержания базы индексов, можно конечно в Оракле:)

Это было раньше.
С приходом веб2 - то-же самое можно хранить в интернете и не иметь хардкоженые УРЛы в букмарках (как я делал с индексирующим сервисом) - так как УРЛы со временем имеют тенденцию меняться.

siberean
() автор топика
Ответ на: комментарий от novitchok

>и не одного поста про корованы и про Кирилла, да, уже не торт ....

Это оттого, что General. Если бы в толксы, то уже бы давно.

ist76 ★★★★★
()
Ответ на: комментарий от siberean

> Попробуйте погуглить на стринг "XQgYnkSBwZXZXZlcm" и вы получите мою статью по ссылке (и ничего более:).

"Погуглить на стринг" ... Да интересное выражение

Кстати попробуйте погуглить еще раз и найдете мой комментарий в дополнение к своему.

sign
()
Ответ на: комментарий от sign

> Кстати попробуйте погуглить еще раз и найдете мой комментарий в дополнение к своему.

... лишь после того как гугел пройдёт по всем страницам лора в очередной раз - со своей индексацией..
(я не знаю - сколько там у них дней сегодня - период прохода)

вообще я не люблю выделять один сёрч-энджин, тем самым ещё больше делая его "Большим Братом", - лучше говорить о сёрч-энджинах вообще.
поэтому стараюсь не использовать глагол "гуглить".
сорри - вырвалось.

siberean
() автор топика
Ответ на: комментарий от siberean

>> Кстати попробуйте погуглить еще раз и найдете мой комментарий в дополнение к своему.

>... лишь после того как гугел пройдёт по всем страницам лора в очередной раз - со своей индексацией.. (я не знаю - сколько там у них дней сегодня - период прохода)

я просто хотел заметить, что просто указания любой строки недостаточно. Ее может скопировать любой человек и разместить где угодно.

В то же время имеется возможность подписывать свои сообщения/файлы электронной подписью, которые подделать крайне сложно. Тогда уж лучше требовать, чтобы сообщения были подписаны ЭЦП, а невалидные сообщения в поиске не участвовали. Да и кстати, можно было бы разработать собственную поисковую машину, которая бы делала именно то, что нужно.

А можно еще так - выложить все свои копии всех своих сообщений на одном сайте в интернет. И поиске указать site:мой_сайт. В этом случае никаких подписей не надо.

sign
()
Ответ на: комментарий от sign

> Ее может скопировать любой человек и разместить где угодно.

> Ее может скопировать любой человек и разместить где угодно.

флаг в руки. Я конечно получу в результате очередного поиска - его мессагу. И пойму - что он хотел что-то сказать.
Но 1) я всегда могу перегенирировать НИД снова; 2) для рекламмных целей - имхо будет очень накладно для таких спаммеров- размещать 22 чара на каждого человека (потом это фактически не спам, а статический сайт - кто разместит чужой НИД. Можно и поругаться на сей счёт - если не убирают. На крайняк - перегенирировать).

> ЭЦП

ЭЦП - уникальна для каждой мессаги - она не даёт возможности группировки. Надо тогда поддерживать базу данных итд.

> А можно еще так - выложить все свои копии всех своих сообщений на одном сайте в интернет. И поиске указать site:мой_сайт.


я считаю - весь смысл - пользоваться неограниченным, 365/24 ресурсом бесплатно, без зависимости от конкретного прова. Гугел же всегда онлайн (даже если в нью-ёркской области - блекаут - электричество будет где-нибудь в Австралийском датацентре). И без поддержания локальной базы и не завязываться на конкретные УРЛы (пусть сайты меняются, покупаются, а сёрч-енджины за пару дней - снова проиндексируют мою дату и вытащат из пучин интернета).
Сейчас таких хуков на персональную дату нет (только в памяти. Но она - не вечна).

siberean
() автор топика

Я не то, чтобы противник Вашей идеи, но по мне - костыль на костыле. Т.е. ваш костыль на костыльном HTTP. Где-то здесь же, на ЛОРе, человек предлагал гораздо более системное решение, которое решает как проблемы HTTP, так и проблемы, поднятые Вами. Я полагаю, что если Вы способны написать RFC, то Вам лучше обратить внимание на его вариант.

Решение было в замене протокола HTTP на протокол, аналогичный jabber. Как я понял, от HTML отказываться при этом не нужно. Замена протокола HTTP на уже существующий, работающий и отлаженный XMPP позволит решить как проблемы HTTP

(такие, как сессии естественным методом, без костылей в виде cookies; единая авторизация во всем интернете естественным образом и реально уникальным ником в виде jid (user@server.dom) без костылей в виде openId; обновление страницы по запросу сервера без костылей в виде ajax, который всё равно по запросу браузера),

так и решит естественным образом Вашу проблему: Ваше имя пользователя станет уникальным естественным образом в момент регистрации, и никакие 22-х символьные включения в мессаджи будут не нужны. Можно будет искать не просто добавив в запрос строку/имя пользователя, а, используя возможности протокола, искать именно сообщения конкретного пользователя.

Я считаю, что лучше направить энергию в это русло, потому как оно будет в итоге полезнее, "фичастее" и правильнее.

name_no ★★
()

господа, вы, наверное, не слышали про т.н. "трип-код"?

А вообще, не надо выкобениваться с английским. Тут его все почти знают.

scaldov ★★
()
Ответ на: комментарий от siberean

>мессаги с уникальным стрингом (коротким, типа XQgYnkgYSBwZXJzZXZlcm

Доводя идею до конца: Каждому человеку при рождении (или когда до кнопок дорастёт - на выбор) выдаётся имя, которое есть уникальный номер его учётной записи (где-то в БД жителей), в кодировке bubble-babble. Оно же является логином для всяких информационных систем.

-- Искренне ваш, xecif-bacor-puvax

DonkeyHot ★★★★★
()
Ответ на: комментарий от name_no

спасибо всем за комменты

> Решение было в замене протокола HTTP на протокол, аналогичный jabber


Помните почему не пошли Корбы/IIOP/JINI и прочие ещё до доткома (когда деньги были повсюду), и наоборот - выкопали IФреймы и вдруг возродили АЯКС-костыль? В основном - потому что были проблемы с фаерволами и никто существующую инфраструктуру менять не намерен (от больших телекомов до маленьких сайтов в которых и постоянного админа нет, не говоря о переделке - инфраструктура не меняется десятилетиями). Вы попробуйте даже простую казалось бы вещь - интегрироваться в единый логин фейсбука (а сотни компаний уже завязалось на это и используют его SSO) - получите отдельный проект по элементарной казалось-бы операции, сколько бы вы не предлагали что-то поменять и сделать красиво и правильно. Есть уже существующая система, которая работает в продакшене, которой пользуются миллионы, она статична, но есть и консультанты - которые знают все костыли.
Я к тому - что существующие большие системы могут только эволюционировать.

HTTP сейчас - как TCP/IP когда-то: костыли, но - реальность, в которой будем жить и которую можно только импрувить мелкими итерациями. Тот-же IPv4.

Я не спорю - что есть менее костылеобразные и красивые решения, но пытаюсь быть реалистом.

> и реально уникальным ником в виде jid (user@server.dom)


не все захотят деанонимизировать интернет. Мой подход опциональный (и по-желанию) и не требует введения единых ключей/нумеровать всех.

И потом - возможность использовать прямо сейчас, на существующих ресурсах (возможно построенных ещё в начале 90-х, и работающих до сих пор почти без переделок).

С затратой почти нулевой энергии на всё это.

siberean
() автор топика
Ответ на: комментарий от DonkeyHot

> Каждому человеку при рождении (или когда до кнопок дорастёт - на выбор) выдаётся имя

Вы всегда на всех ресурсах (есть и полностью анонимные) используете своё настоящее имя в конце?

Односторонний хэш - не нарушает анонимность. Я могу генерировать НИДы каждый день и использовать новые (поддерживая у себя базу данных генерированный мной когда-то NID'ов) - если надо.

Потом в одном китае - миллионы с одним и тем-же именем-фамилией (у них там какбы большая проблема с коллизиями имён).

Но третье и основное: моё предложение (зачатки простого протокола) позволяет _группировать_ мою информацию (что кстати можно было-бы сделать и в случае имени - если бы оно было уникальным и если предположить что оно состоит из одного большого токена - что можно решить кавычками в запросе, конечно).
В случае имени будут сложности группировки. Следующее будет необходимо чтобы сделать запрос:
"кейворд1 кейворд2" (и браузер в действительности сделает поиск документов: "Вася Пупкин кейворд1" AND "Вася Пупкин кейворд2" - чтобы вытащить из пучин интернета только этот документ (и чтобы в тоже времени быть независимым от порядка кейвордов).

/Вася Пупкин кейворд1 Вася Пупкин кейворд2.

что не лучше а хуже имхо.

я просто занимался сёрченджинами просто (веса там в зависимости от расстояния, пересечения множеств, что индексируется) на проф. основе, и обычно представляю со стороны индексации - как же оно там и что будет индексироваться, и как организовать группы (моей информации, разбросанной по инету под разными анонимными никами). Пока я имею хуки только в голове, но например мои дети или я в старческом маразме - не смогу достать все хуки, и куча инфы будет утеряна. (опять же не говоря о том - что УРЛы меняются).
Вы наверное держите огромную базу данных букмарков, да?
Попробуйте пройтись по ним через 10 лет. Или наоборот - увидите копии информации, запосченной вами, но теперь - на индусских, китайских зеркалах (тех букмарков у вас и быть не может). А имея NID в конце - вы не зависите вообще от домейна и УРЛа. (стирание NIDа, поставленного автором, - можно считать изменением документа и ввести в кодекс неэтичных действий).

siberean
() автор топика
Ответ на: комментарий от scaldov

> господа, вы, наверное, не слышали про т.н. "трип-код"?

да, трип-код очень близок

но:
1) предлагается всеобщий аналог трип-кода - для всего интернета (не одного форума). Стандартизованный.
2) более устойчивый (one-way hash от тупла имени, даты рождения + salt),
невозможность кракнуть назад как с crypt
3) см. ранее про группировку (протокол приаттачивания кейвордов)

siberean
() автор топика

кстати, я недооценивал гугел - он судя по всему проходится по сайтам каждую ночь.
Уже проиндексировал стринг: "XQgYnkgYSBwZXJzZXZlcm"


и по кивордам можно уже искать (будет одна мессага - в отличие от первого запроса ;)

"XQgYnkgYSBwZXJzZXZlcmNID XQgYnkgYSBwZXJzZXZlcmpLOR"

(ну вы поняли - что в браузеровском плагине - можно будет писать просто: "NID LOR" - вместо вышеприведённого длинного стринга, да? И как это реализовать другими способами?)

siberean
() автор топика
Ответ на: комментарий от siberean

Будучи совсем уж не скромным - можно сказать - что предлагается не просто метод хуков на ресурсы, независимых от УРЛов, а вообще - расширение ассоциативной памяти человека. Не так разве?

siberean
() автор топика

1. Не вижу особого профита в поиске по всем именно своим мессагам. (С другой стороны, я держу у себя весь кэш веб-страничек, посещенных мной, так что по ним можно поискать и мои мысли.)

2. Подделка с целью спама (лично вам в руки, да), и даже просто цитирование этих НИД-ов заставят их расползтись как нефтяное пятно по воде :-) Поддержка подписей потребует усилий со стороны поисковых систем.

_______________________________________

С другой стороны, персонализованные поисковые системы (по ограниченному кругу сайтов ограниченной группы людей) были бы мне интересны.

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от www_linux_org_ru

Да, и там можно было бы прикручивать эксперементальные алгоритмы, например учет NID-ов, только если мессаги подписаны.

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от www_linux_org_ru

> Не вижу особого профита в поиске по всем именно своим мессагам.

я руководствуюсь следующим законом:
для вас (и меня, и любого другого) - важны в любом документе/страничке только лишь те ассоциации - которые у вас появились в момент прочтения. Вы увидели одно, я - другое (в одной и той-же статье) и для нас это имеет разную ценность.
А интернет который мы ещё не видели и не сформировали ассоциации - его можно считать несуществующим, хоть сёрч результат и пишет там миллионы ответов/ресультатов. Для вас ценно только то - что УЖЕ ПРОШЛО ЧЕРЕЗ ВАС и ОСТАВИЛО какие-то ассоциации.
В идеале - я хочу сразу-же, в момент просмотра - пустить стрелы-хуки на всё на что я смотрю (под теми ключами, которые у меня возникли в мозгу как первые ассоциации - ведь они самые и единственные верные потому что остальное я просто не распарсил и его для моего мозга пока не существует) и в последствии - иметь возможность собрать всё воедино.
Это - раширение ассоциативной памяти человека (right-side поинтера, left-side - всегда персональна. Правая часть - может валяться в интернете).
Т.е. нужны какие-то уникальные ID на страницах.
Да, grep'анье вашего кэша - может помочь (сузить поиски), но вы долзны знать - по чему grep'ать (а это - ключи, которые должны остаться в какой-то базе. ).
"Локальный оракле для индекса" я предлагаю вынести в интернет чтобы быть всегда мобильным и спокойным за сохранность этой базы.

siberean
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.