LINUX.ORG.RU
ФорумTalks

Оптимизация изучения взаимосвязанных понятий с помощью графов.

 , , , ,


2

1

Представьте, что вы решили узнать всю подноготную об мире Гарри Поттера. Будем считать, что непосредственно книги читать нельзя.

Вы открываете Википедию и находите там статью «Гарри Поттер». И в какой-то момент вы видите что-то вроде «Список врагов Гарри Поттера: Северус Снейп, Люциус Малфой ,Драко Малфой ,Лорд Воландеморт ,и т.д.»

Причем каждое имя ведет на соответствующую статью в Википедии. Кто эти люди, спрашивается? Предположим, вы открываете статью «Люциус Малфой». И после бегло просмотра понимаете, что это отец Драко Малфоя. Потом открываете статью «Драко Малфой» и после такого же бегло просмотра понимаете, что Драко учится в Слизерине и является любимчиком Северуса Снейпа. Что такое Слизерин и кто такой Северус Снейп? Открываем страницу «Слизерин» и видим «Один из четырех факультетов Хогвартса». А что такое Хогвартс?

И т.д. Думаю проблема понятна. Я конечно ее даже упростил, ведь реальные статьи гораздо больше по объему. Будем считать, что вы смогли за приемлемое время создать граф. И например от кружка, который обозначает статью «Люциус Малфой» , идет линия со стрелкой к кружку «Драко Малфой». А от него в свою очередь идут линии к кружкам «Слизерин» и «Северус Снейп». И т.д

В каком порядке вы будете изучать статьи на основании той информации, что вы получили с помощью данного графа? Например, может быть вы решите, что лучше изучать статьи с наименьшим числом «связей»? Или наоборот, с наибольшим? Еще что-нибудь сделаете(например, реорганизуете полученный граф по какому-то принципу)?

Мне кажется, что оптимальным будет следующий подход:

Начинать c тех понятий, которые содержат минимум отсылок(учитываем смысловую отсылку, а не простые гиперссылки. Так например, в статье об Слизерине будет явная или неявная отсылка к Хогвартсу) на другие. Если есть несколько статей, каждая из которых ссылается на равное число других, из них выбираем те статьи, на которые ссылается как можно больше других статей. Короче, идеальная статья для начала - это та, на которую ссылаются чаще, чем на другие, но которая, в свою очередь, почти не на какие не ссылается. Не лишне было бы составить соответствующую иерархию. Например так: за каждую ссылку на данную статью прибавляем ей один балл. За каждую ссылку этой статьи на какую-нибудь другую отнимаем балл. Дальше расставляем статьи в порядке убывания итоговой оценки. В таком порядке и изучаем материал.

Deleted

Последнее исправление: Deleted (всего исправлений: 3)

Где тег «вещества»?

Xellos ★★★★★
()

А если по сути - ты чрезмерно упростил ситуацию. Потому что связь Малфоя-младшего со Снейпом качественно отличается от связи Гарри Поттера с Хогвартсом. Первая - уточняющая, Драко Малфой может существовать и без связи со Снейпом. А вот вторая - определяющая, ибо без Хогвартса не о чем говорить вообще.

Xellos ★★★★★
()
Ответ на: комментарий от Xellos

Ну да, я упростил ситуацию, я об этом уже говорил.

Первая - уточняющая

Иначе говоря, для того чтобы понять, кто такой Драко Малфой, совсем не обязательно знать об Снейпе. Верно и обратное, объект «Снейп» вполне может быть понятен без связи с Драко Малфоем.

Может быть лучше совсем игнорировать такие «уточняющие связи» при составлении графа?

А вот вторая - определяющая, ибо без Хогвартса не о чем говорить вообще.

Разве? Ведь мы можем понять кто такой Гарри и без Хогвартса. А вот понять Слизерин, для примера, без знания понятия «Хогвартс» уже нельзя.

Плюс, я бы еще выделил синонимическую связь. Например, Лорд Воландеморт и Тот-Кого-Нельзя-Называть это синонимы. Думаю в такой связи нет особого смысла, поэтому при создании графа это можно игнорировать.

И еще, как насчет того, чтобы при составления графа создавать вершины-категории? Например, создать вершину «волшебники», которая будет ссылаться на вершины «маглорожденные волшебники», «чистокровные волшебники» и «волшебники-полукровки». В свою очередь, вершина «чистокровные волшебники», для примера, будет ссылаться на Драко Малфоя, Люциуса Малфоя и т.д.

Меня волнуют также такие вопросы:

1.В чем недостатки предложенного мною способа работы с полученным графом?

2.Если есть более оптимальный способ работы с полученным графом, то как он выглядит?

3.Есть ли кроме графов другой, принципиально отличный способ структуирования знаний? И если да, то какой?

Deleted
()
Ответ на: комментарий от Deleted

Думаю что определяющим фактором будет структура данных в условиях исходной задачи. А в с случае общего интереса ты быстро выйдешь за рамки такой задачи.

sin_a ★★★★★
()
Последнее исправление: sin_a (всего исправлений: 1)
Ответ на: комментарий от sin_a

Хорошо, вот специфика задачи.

Я изучал английский язык «дикарем». В результате я сегодня имею хороший словарный запас, более-менее сносно читаю на английском, но при этом знание английской грамматики хромает на обе ноги. Плюс ситуация осложняется еще и тем, что я и в русской грамматике плохо разбираюсь. Например, что такое «предложное дополнение»? А фиг его знает.

Сначала я пытался изучать английскую грамматику по Бонк, но пришел просто в ужас от встречающихся там кругов в определениях понятий.

После чего приобрел красный Мёрфи, который мне очень понравился. Там действительно все написано хорошим языком. Другое дело, что это СПРАВОЧНИК, а не учебник. В нем не хватает структуры а-ля «от основ к более сложному материалу», иначе он был бы просто идеален. И именно эту структуру, с помощью вышеописанного метода, я бы и хотел создать. Благо там есть хороший индекс и заглавие, которые будут хорошим подспорьем в этом деле.

Deleted
()

Берешь большую белую доску, на нее наклеиваешь фотографии, вырезки из газет, желтые бумажки с заметками, проводишь между ними линии маркером обозначающие связи. Раскрываешь масонский заговор.

Absurd ★★★
()
Ответ на: комментарий от sin_a

По моему ты крылатую ракету наводишь на стаю воробьёв

А что, чем плох предложенный мною метод, если его грамотно реализовать?

А просто учителя хорошего нет?

Я уже итак хожу на курсы английского. Мой уровень определили как Pre-intermediate. Но боюсь, что моей бедной грамматике от этого стало не сильно лучше.

Deleted
()

Для изучения лучше начать с вершин с наибольшими степенями. Например, с Хогвартса и Поттера. Меньше степень — скорее всего меньше важность.

Sadler ★★★
()
Ответ на: комментарий от Deleted

Да нет, не плох, просто как мне кажется в данном случае в некотором роде избыточен. Можно его рассмотреть, если интересно, сам по себе, не применительно к структурам грамматики. А для грамматики, говорят, полезно общение с носителями.

sin_a ★★★★★
()
Ответ на: комментарий от sin_a

А для грамматики, говорят, полезно общение с носителями.

Если бы я мог лет 10 пожить в англоязычной стране, то я бы даже не стал заморачиваться, скорее всего. Другое дело, что у меня такой возможности нет, и что более формальная проработка знаний грамматики помогает значительно ускорить данный процесс.

И еще, меня интригует вот какой вопрос. Создатели разных учебников(не только по грамматике, а вообще) каким образом структуируют преподаваемые знания? Создают или они все чисто с помощью интуиции и опыта, или же могут использоваться какие-то специальные методики? И если да, то какие?

Deleted
()
Ответ на: комментарий от Deleted

Смотри кино, читай литературу, общайся по видеотелефону. На интересующем языке, в смысле.

А вопросы твои по филологии (или лингвистике?). Разумеется у языка есть некая структура, он так отражает реальность. Но здесь это не профильное.

sin_a ★★★★★
()

берем вики, парсим ссылки в каждой статье, составляем граф, PROFIT!!1

jcd ★★★★★
()
Ответ на: комментарий от Deleted

Мне кажется, тебе стоит идти от вопросов. Зачем тебе знать грамматику? Чтобы формировать предложения? Вот берёшь конкретное предложение и пытаешься его построить. По справочнику или учебнику ищешь понятия. Ну и строишь их на английском.
Или берёшь короткие тексты (части текстов) и делаешь синтаксический разбор предложений. Начинаешь с коротких, заканчиваешь длинными.

Лично у меня знания появляются скорее от практики, чем от ботания теории. То есть вот после 25, когда я начал в больших количествах потреблять английские тексты, я начал частично вспоминать, что в меня вбивали 7 лет в школе и 3 года в институте. А пока вбивали я тоже ничего не понимал.

Xellos ★★★★★
()
Ответ на: комментарий от Deleted

1.В чем недостатки предложенного мною способа работы с полученным графом?

недостаток информации. Нехватает кластера «география»,«общественно-политическое устройство»,«история» etc. Если их все дополнить, то выйдет что проще прочитать оригиналы. хотя имея охватывающий граф вы можете написать продолжение ГП, или отдельный рассказ в том-же мире (см. писательский софт).

2.Если есть более оптимальный способ работы с полученным графом, то как он выглядит?

разве что возможность добавлять собственные семантические связи, кластеры и «заметки на полях». Как конспекты,закладки и шпаргалги IRL

3.Есть ли кроме графов другой, принципиально отличный способ структуирования знаний? И если да, то какой?

всё сводимо к графам.

MKuznetsov ★★★★★
()
Ответ на: комментарий от Deleted

Другое дело, что это СПРАВОЧНИК, а не учебник.

Ну так купи себе именно учебник. Там умные люди уже за тебя подобрали порядок изучения понятий.

Сложные вещи по справочникам выучить нереально. Точнее, реально, но просто потратишь кучу времени зря.

provaton ★★★★★
()

еще так: при прочтении первой статьи из списка, все, которые на нее ссылались, получают дополнительно (временный) буст 0,5-1,5 балла и, возможно, оказываются несколькими строчками выше. итд

MyTrooName ★★★★★
()
Ответ на: комментарий от Deleted

А что, MindMap умеет находить кратчайший путь в графах и все такое?

Еще скажи что тебе k means clustering, какой-нибудь, нужен. Дело в том что при подобном подходе у тебя каждое ребро графа будет нести некую семантику (описанный тобой тип организации знаний то давно известен), и в таком случае бессмысленными являются попытки что либо упорядочить автоматически(без добавления каких-либо правил дополнительных). Тема была когда-то достаточно популярна у всяких дядек с machine learning, поэтому гугли, читай, может чего родишь.

Но ты всегда можешь составить постой граф связанных понятий, решить на нём задачу коммивояжера, дабы не повторять пройденного, и все. Это единственное что я могу придумать

RedPossum ★★★★★
()
Ответ на: комментарий от Xellos

Ну наверно не который прямо пишет, а некоего вспомогательного характера. Что бы не заблудиться в этих своих персонажах... Их же нынче модно делать много, как собак нерезанных. Количество писательского таланта компенсируется обилием персонажей и деталей.

sin_a ★★★★★
()
Формализовать задачу можно следующим образом: пусть имеются N статей, и L[i][j] = 1, если i-я статья ссылается на j-ю. Таким образом, L - матрица перекрестных ссылок. Далее предположим, что у любой статьи есть входящие ссылки. Пусть R[i] - степень понимания ранее прочитанной статьи i, от 0 до 1. И пусть чтение i-й статьи позволяет понять ее полностью или нет, в зависимости от числа ранее прочитанных статей, на которые она ссылается:

f(i) = b[i] + (1 - b[i]) * sum по j(w[j]*R[j])/sum по j(w[j]*L[j][i]), где 0<=f(i)<=1, для простоты линейная зависимость, b - уровень понимания статьи с 0 прочитанных ссылок, (1-b[i]) - нормировка, w[j] - некоторый весовой коэффициент.

Таким образом, понимание статьи основывается на определенных знаниях читателя, не связанных с целевой тематикой, и даже ничего не знающий по теме может понять b[i]-ю часть смысла. А прочтение каждой связанной тематической статьи добавляет к пониманию еще немножко. Повторяя процесс для разных статей, можно придти к полному пониманию. Для входа целесообразным является чтение статей, понятных неподготовленному читателю (большие b[i]) и имеющих много исходящих ссылок ( sum(L[i][j]) - велика ) и мало входящих ссылок ( sum[j][i] мала).

Задача сводится к тому, чтобы (видимо на основе экспертных оценок) выставить или как-то оценить коэффициенты и веса и далее упорядочить все статьи так, чтобы R(i)=1 для всех достигался при минимальном общем числе чтений. Алгоритм сейчас выдумывать лень.
amomymous ★★★
()
Последнее исправление: amomymous (всего исправлений: 1)
Ответ на: комментарий от amomymous

Для использовании в тексте тегов надо скобки писать два раза: [code]test[/code]. Возможно скобки в при любом использовании так надо. В описании разметки LORCODE это есть, в конце.

sin_a ★★★★★
()
Ответ на: комментарий от Xellos

Ну мне вот было бы интересно поглядеть на такой тоже.

раньше любопытствовал, насколько могу судить наиболее популярны и продвинуты (хоть и небесплатны)

http://www.writerscafe.co.uk/

https://www.literatureandlatte.com/scrivener.php

гугл также даёт обзор :

http://help.ubuntu.ru/fullcircle/30/писатель

тыщщи их, просто область применения далека от ЛОР`а и потому они тут малоизвестны :)

MKuznetsov ★★★★★
()
Ответ на: комментарий от sin_a

Спасибо, в следующий раз я буду знать. Стыдно, на самом деле, звезду давно заслужил, а писать скобки только сейчас учусь.

amomymous ★★★
()
Ответ на: комментарий от Dobriy_i_Prostoy

Вы уверены? Мне всегда казалось, что MindMap это не более, чем еще один вариант визуализации информации для менеджеров и прочих деловых сосисок. И что 99% пользователей MindMap скорее удавятся, чем пожелают слышать что-либо об графах, задаче коммивояжера и тому подобных вещах.

Deleted
()
Ответ на: комментарий от Dobriy_i_Prostoy

MindMap — представление данных в виде дерева

Фактически, это разновидность старых добрых графов. И зачем тогда огород городить, спрашивается?

Deleted
()
Ответ на: комментарий от jtootf

О, да, ISO 12620 и все-все-все. Автор, если осилишь - нам не забудь рассказать :)

Xellos ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.