LINUX.ORG.RU
ФорумTalks

Смысловая векторизация


0

0

Пошел покурить и что-то вспомнился рассказ то-ли из Юного Техника а может из Химии и Жизни - не помню. Что-то в стиле фантастики на тему Джеймса Бонда но в будущем. Помню лишь момент, когда главный герой летит над Атлантикой на каком-то мега-самолёте будущего, на него сыпятся покушения как из рога изобилия и, в т.ч., из океана всплывает подлодка, запускает ракету земля-воздух, ракета догоняет судно и тихонечко присоединяется к корпусу вровень под его местом. После начинает испускать мощный направленный пучок ионизирующего излучения с целью погубить супермена. Но он типа не дурак, у него в зад вшит детектор он все чувствует, врывается в кабину пилотов и те уводят пассажиров в другое крыло лайнера. Ну и так далее. Жвачка в принципе, но было забавно.

Но я собственно не о рассказе. Как водится, такие вещи обычно скидывают в тот же ЛОР в надежде, что кто-то вспомнит по заданному описанию ту или иную книгу. В данном случае фрагмент из книги буква в букву - это растр. Свободное же описание с сохранением общего смысла в той или иной пропорции - это скорее векторное представление.

Интересно, какие существуют системы для автоматической 'смысловой векторизации' связанной информации? Допустим, с целью последующего поиска по полученным шаблонам. Причем не на уровне 'мама мыла раму' и входящими в предложение словами, но, скажем 'тетя мыла окно' что в принципе тоже сходится с заданной степенью попадания.


ты забыл тег [Вещества!!]

drakmail ★★★★
()

Детка, когды выучишься, поступишь в вуз, там тебе расскажут и это. Правда, если твой мозг слаб, то ты будешь спать и выйдешь из вуза бестолочью позорящей наше образование.

wfrr ★★☆
()
Ответ на: комментарий от wfrr

Детка, когды выучишься, поступишь в вуз, там тебе расскажут и это. Правда, если твой мозг слаб, то ты будешь спать и выйдешь из вуза бестолочью позорящей наше образование.

Белка, не дерзи. Тем более попусту. Есть что сказать по делу - скажи.

bibi
() автор топика

Мне думается что единственный вариант — это построение карты мозга с выявлением истинной нейросетевой модели мышления по аналогии, и уж затем классификация входных сигналов (в виде текстов, растров) и сопоставление им координат (векторизация), только координат именно в рамках пространства возможных состояний найденной модели мышления по аналогии, а не по якобы видным нам сейчас уровням, которые поверхностны.

mclaudt
()
Ответ на: комментарий от bibi

Еслиб я вспомнил как это называлось, то сказалбы, а так приходится .... ну ты понял. В общем это про системы поиска информации (не только по запросам «видео секс с гентушницами»), они примерно темже занимаются - строят «образ» документа. Если не усну то яндексуйну ченить.

wfrr ★★☆
()
Ответ на: комментарий от mclaudt

Зощитано, изясняться так чтобы тя зауважали умеешь.

wfrr ★★☆
()
Ответ на: комментарий от wfrr

Еслиб я вспомнил как это называлось, то сказалбы, а так приходится .... ну ты понял. В общем это про системы поиска информации (не только по запросам «видео секс с гентушницами»), они примерно темже занимаются - строят «образ» документа. Если не усну то яндексуйну ченить.

Боюсь, то, что предлагают обычному пользователю текущие поисковики включая гуглу слишком примитивно и действительно на уровне поискать по секс, видео и гентушники. Может, на полшага дальше за счет грамотного ранжирования но не более. Выдаваемые результаты слишком прямолинейны - видео+секс+гентушники, ничего более. Или же просто мусор.

Я не могу задать гуглу, допустим, семантическое описание и он под него подберет похожий образ. Причем не теми словами, какими оно было описано в запросе а, как правило, и вовсе другими. Собственно поиск литературных произведений по примерным описаниям отрывков - вполне хороший пример того, что имеется ввиду.

Я не хочу сказать, что это нереализуемо. Лишь то, что сегодня поисковики очень далеки от указанного уровня поиска.

bibi
() автор топика

Как ты себе такое представляешь?

/пошёл спать, ответ прочту завтра а сам ответить смогу не раньше вечера.

sin_a ★★★★★
()
Ответ на: комментарий от sin_a

Как ты себе такое представляешь?

Я себе вполне могу представить конкретные use-case. А вот реализацию - пока что с заметным трудом. В лучшем случае где-то на уровне интуиции. Потому и спрашиваю.

bibi
() автор топика
Ответ на: комментарий от bibi

Я не хочу сказать, что это нереализуемо. Лишь то, что сегодня поисковики очень далеки от указанного уровня поиска.

Поисковики не показывают это юзеру, потому что это ему не нужно. Бо составить модель того что хочет найти на машинном языке он не сможет, а на естественном языке машина не поймет, а спецам работащим с базами знаний такое доступно. Опять же механизм релевантности может работать через такой механизм (по моему гуголь, яндекс так и работают, только вот они не допускают что тетя и мам одно и тоже, ибо юзер удивится).

Вот еще по теме http://ru.wikipedia.org/wiki/Представление_знаний а собственно преобразование в эти способы представления - поисковые системы, экспертные системы (которые какбы самообучатся умеют) и т.п. Про поисковые алгоритмы нам давали лекции, но блин в интернете вская херь попадается по этой теме.

wfrr ★★☆
()
Ответ на: комментарий от wfrr

поддерживаю. пользуй клипс, строй падежные фреймы. оно это умеет. если надобно куда-нибудь методичку по этим делам скинуть могу, правда очень уж примитивную.

RedPossum ★★★★★
()
Ответ на: комментарий от wfrr

Кажись нашел, посмотри книгу «Теория хранения и поиска информации».

wfrr ★★☆
()

Это в Химии и Жизни было, в поздних 90х. И даже не рассказ, а больше как повесть, на несколько номеров было растянуто. А события разворачивались где-то как-раз в наше время - начало 21-го века, у героя еще был мега-нетбук, который он в итоге выбросил с самолета...

qWen71n ★★★
()
Ответ на: комментарий от qWen71n

разумеется в поздних 80х, последняя бутылка пыва была явно лишней...

qWen71n ★★★
()

Практически не по теме, тем не менее почему-то вспомнилось: http://en.akinator.com/# - баян, задаёт наводящие вопросы и угадывает, что ты загадал. Думаю, надо сделать такое же, только по книгам/фильмам.

Nixopatolog
()
Ответ на: комментарий от rip_someday

рассаз, кстати, если правильно понял - вот это http://2lib.ru/getbook/740.html

Да, это он :)

Вот видите, коллективный разум восторжествовал и в конечном итоге выдал корректный ответ. Было бы забавно увидеть что-то подобное но в цифре.

bibi
() автор топика
Ответ на: комментарий от bibi

Да use case-то представить несложно, нужна большая красная кнопка сделать пи...кгхм, где-то я это уже слышал. Нет уж, лучше думать хотя-бы о реализации.

Для того что-бы хранить информацию о содержании текста, его нужно _понять_. Что такое понять? Выделить содержание?

Ты читал чего нибудь про знаковые системы?

sin_a ★★★★★
()
Ответ на: комментарий от sin_a

Ты читал чего нибудь про знаковые системы?

Нет, не читал. Ссылку на литературу, что дала белка... Нет, спасибо ей за это, но я скорее хотел услышать не частный матаппарат но концепции.

Концепция, идея - она всегда простая, как 3 рубля. В её суть может легко вникнуть практически любой. Далеко не только сугубо специализированный специалист. Но это и не use-case. И не буквальное руководство к действию. Это скорее проработанная стратегия на заданную проблемную тему.

Я пока что не могу родить осознанно такую идею. Хотя интуитивно она витает прямо здесь. Осталось лишь найти силу воли чтобы сконцентрироваться, и поймать её за хвост и вылить в слова.

Все и всегда начинается с интуиции.

bibi
() автор топика
Ответ на: комментарий от bibi

Да концепция-то проста. Знаковая система, по сути, это набор аксиом и набор правил синтаксиса, ими занимается специальная наука семиотика. Так вот нужна некоторая знаковая система, в которую можно переводить текст на естественном языке. То есть нужно выделять существенные, значимые, элементы текста, смысловые узелки, и ими и манипулировать. Естественный язык это тоже, конечно, знаковая система, но он возникал в специфических условиях, с определёнными требованиями и слабо формализован. Можно например, взять образец текста на естественном языке и попробовать выделить в нём узловые элементы. Для начала :)

sin_a ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.