Оптимизация изучения взаимосвязанных понятий с помощью графов.

brainfuck, brainstorm, логика, математика, матчасть

2

1

Представьте, что вы решили узнать всю подноготную об мире Гарри Поттера. Будем считать, что непосредственно книги читать нельзя.

Вы открываете Википедию и находите там статью «Гарри Поттер». И в какой-то момент вы видите что-то вроде «Список врагов Гарри Поттера: Северус Снейп, Люциус Малфой ,Драко Малфой ,Лорд Воландеморт ,и т.д.»

Причем каждое имя ведет на соответствующую статью в Википедии. Кто эти люди, спрашивается? Предположим, вы открываете статью «Люциус Малфой». И после бегло просмотра понимаете, что это отец Драко Малфоя. Потом открываете статью «Драко Малфой» и после такого же бегло просмотра понимаете, что Драко учится в Слизерине и является любимчиком Северуса Снейпа. Что такое Слизерин и кто такой Северус Снейп? Открываем страницу «Слизерин» и видим «Один из четырех факультетов Хогвартса». А что такое Хогвартс?

И т.д. Думаю проблема понятна. Я конечно ее даже упростил, ведь реальные статьи гораздо больше по объему. Будем считать, что вы смогли за приемлемое время создать граф. И например от кружка, который обозначает статью «Люциус Малфой» , идет линия со стрелкой к кружку «Драко Малфой». А от него в свою очередь идут линии к кружкам «Слизерин» и «Северус Снейп». И т.д

В каком порядке вы будете изучать статьи на основании той информации, что вы получили с помощью данного графа? Например, может быть вы решите, что лучше изучать статьи с наименьшим числом «связей»? Или наоборот, с наибольшим? Еще что-нибудь сделаете(например, реорганизуете полученный граф по какому-то принципу)?

Мне кажется, что оптимальным будет следующий подход:

Начинать c тех понятий, которые содержат минимум отсылок(учитываем смысловую отсылку, а не простые гиперссылки. Так например, в статье об Слизерине будет явная или неявная отсылка к Хогвартсу) на другие. Если есть несколько статей, каждая из которых ссылается на равное число других, из них выбираем те статьи, на которые ссылается как можно больше других статей. Короче, идеальная статья для начала - это та, на которую ссылаются чаще, чем на другие, но которая, в свою очередь, почти не на какие не ссылается. Не лишне было бы составить соответствующую иерархию. Например так: за каждую ссылку на данную статью прибавляем ей один балл. За каждую ссылку этой статьи на какую-нибудь другую отнимаем балл. Дальше расставляем статьи в порядке убывания итоговой оценки. В таком порядке и изучаем материал.

Ссылка

←	vfat и 500000 файлов

OpenGL 3.1 в radeonsi

→

Где тег «вещества»?

Xellos ★★★★★
(05.11.13 08:13:03 MSK)

Ссылка

А если по сути - ты чрезмерно упростил ситуацию. Потому что связь Малфоя-младшего со Снейпом качественно отличается от связи Гарри Поттера с Хогвартсом. Первая - уточняющая, Драко Малфой может существовать и без связи со Снейпом. А вот вторая - определяющая, ибо без Хогвартса не о чем говорить вообще.

Xellos ★★★★★
(05.11.13 08:16:46 MSK)

Ответ на: комментарий от Xellos 05.11.13 08:16:46 MSK

Ну да, я упростил ситуацию, я об этом уже говорил.

Первая - уточняющая

Иначе говоря, для того чтобы понять, кто такой Драко Малфой, совсем не обязательно знать об Снейпе. Верно и обратное, объект «Снейп» вполне может быть понятен без связи с Драко Малфоем.

Может быть лучше совсем игнорировать такие «уточняющие связи» при составлении графа?

А вот вторая - определяющая, ибо без Хогвартса не о чем говорить вообще.

Разве? Ведь мы можем понять кто такой Гарри и без Хогвартса. А вот понять Слизерин, для примера, без знания понятия «Хогвартс» уже нельзя.

Плюс, я бы еще выделил синонимическую связь. Например, Лорд Воландеморт и Тот-Кого-Нельзя-Называть это синонимы. Думаю в такой связи нет особого смысла, поэтому при создании графа это можно игнорировать.

И еще, как насчет того, чтобы при составления графа создавать вершины-категории? Например, создать вершину «волшебники», которая будет ссылаться на вершины «маглорожденные волшебники», «чистокровные волшебники» и «волшебники-полукровки». В свою очередь, вершина «чистокровные волшебники», для примера, будет ссылаться на Драко Малфоя, Люциуса Малфоя и т.д.

Меня волнуют также такие вопросы:

1.В чем недостатки предложенного мною способа работы с полученным графом?

2.Если есть более оптимальный способ работы с полученным графом, то как он выглядит?

3.Есть ли кроме графов другой, принципиально отличный способ структуирования знаний? И если да, то какой?

Deleted
(05.11.13 08:40:18 MSK)

Задача практическая или общий интерес?

sin_a ★★★★★
(05.11.13 09:14:32 MSK)

Ответ на: комментарий от sin_a 05.11.13 09:14:32 MSK

Практическая. Хотя и интерес сам по себе тоже есть.

Deleted
(05.11.13 09:23:58 MSK)

Ответ на: комментарий от Deleted 05.11.13 09:23:58 MSK

Думаю что определяющим фактором будет структура данных в условиях исходной задачи. А в с случае общего интереса ты быстро выйдешь за рамки такой задачи.

sin_a ★★★★★
(05.11.13 09:30:36 MSK)
Последнее исправление: sin_a 05.11.13 09:30:47 MSK (всего исправлений: 1)

Ответ на: комментарий от sin_a 05.11.13 09:30:36 MSK

Хорошо, вот специфика задачи.

Я изучал английский язык «дикарем». В результате я сегодня имею хороший словарный запас, более-менее сносно читаю на английском, но при этом знание английской грамматики хромает на обе ноги. Плюс ситуация осложняется еще и тем, что я и в русской грамматике плохо разбираюсь. Например, что такое «предложное дополнение»? А фиг его знает.

Сначала я пытался изучать английскую грамматику по Бонк, но пришел просто в ужас от встречающихся там кругов в определениях понятий.

После чего приобрел красный Мёрфи, который мне очень понравился. Там действительно все написано хорошим языком. Другое дело, что это СПРАВОЧНИК, а не учебник. В нем не хватает структуры а-ля «от основ к более сложному материалу», иначе он был бы просто идеален. И именно эту структуру, с помощью вышеописанного метода, я бы и хотел создать. Благо там есть хороший индекс и заглавие, которые будут хорошим подспорьем в этом деле.

Deleted
(05.11.13 09:49:04 MSK)

Берешь большую белую доску, на нее наклеиваешь фотографии, вырезки из газет, желтые бумажки с заметками, проводишь между ними линии маркером обозначающие связи. Раскрываешь масонский заговор.

Absurd ★★★
(05.11.13 09:51:05 MSK)

Ссылка

Ответ на: комментарий от Deleted 05.11.13 09:49:04 MSK

По моему ты крылатую ракету наводишь на стаю воробьёв. А просто учителя хорошего нет?

sin_a ★★★★★
(05.11.13 10:12:44 MSK)

Ответ на: комментарий от sin_a 05.11.13 10:12:44 MSK

По моему ты крылатую ракету наводишь на стаю воробьёв

А что, чем плох предложенный мною метод, если его грамотно реализовать?

А просто учителя хорошего нет?

Я уже итак хожу на курсы английского. Мой уровень определили как Pre-intermediate. Но боюсь, что моей бедной грамматике от этого стало не сильно лучше.

Deleted
(05.11.13 10:19:43 MSK)

Для изучения лучше начать с вершин с наибольшими степенями. Например, с Хогвартса и Поттера. Меньше степень — скорее всего меньше важность.

Sadler ★★★
(05.11.13 10:23:27 MSK)

Ссылка

Ответ на: комментарий от Deleted 05.11.13 10:19:43 MSK

Да нет, не плох, просто как мне кажется в данном случае в некотором роде избыточен. Можно его рассмотреть, если интересно, сам по себе, не применительно к структурам грамматики. А для грамматики, говорят, полезно общение с носителями.

sin_a ★★★★★
(05.11.13 10:23:59 MSK)

Ответ на: комментарий от sin_a 05.11.13 10:23:59 MSK

А для грамматики, говорят, полезно общение с носителями.

Если бы я мог лет 10 пожить в англоязычной стране, то я бы даже не стал заморачиваться, скорее всего. Другое дело, что у меня такой возможности нет, и что более формальная проработка знаний грамматики помогает значительно ускорить данный процесс.

И еще, меня интригует вот какой вопрос. Создатели разных учебников(не только по грамматике, а вообще) каким образом структуируют преподаваемые знания? Создают или они все чисто с помощью интуиции и опыта, или же могут использоваться какие-то специальные методики? И если да, то какие?

Deleted
(05.11.13 10:32:19 MSK)

Ответ на: комментарий от Deleted 05.11.13 10:32:19 MSK

Смотри кино, читай литературу, общайся по видеотелефону. На интересующем языке, в смысле.

А вопросы твои по филологии (или лингвистике?). Разумеется у языка есть некая структура, он так отражает реальность. Но здесь это не профильное.

sin_a ★★★★★
(05.11.13 10:37:35 MSK)

Ссылка

берем вики, парсим ссылки в каждой статье, составляем граф, PROFIT!!1

jcd ★★★★★
(05.11.13 10:51:38 MSK)

Ссылка

Ответ на: комментарий от Deleted 05.11.13 09:49:04 MSK

Мне кажется, тебе стоит идти от вопросов. Зачем тебе знать грамматику? Чтобы формировать предложения? Вот берёшь конкретное предложение и пытаешься его построить. По справочнику или учебнику ищешь понятия. Ну и строишь их на английском.
Или берёшь короткие тексты (части текстов) и делаешь синтаксический разбор предложений. Начинаешь с коротких, заканчиваешь длинными.

Лично у меня знания появляются скорее от практики, чем от ботания теории. То есть вот после 25, когда я начал в больших количествах потреблять английские тексты, я начал частично вспоминать, что в меня вбивали 7 лет в школе и 3 года в институте. А пока вбивали я тоже ничего не понимал.

Xellos ★★★★★
(05.11.13 10:53:10 MSK)

Ссылка

Гарри Поттера

Язабан.

По теме:

MindMap </thread>

Dobriy_i_Prostoy ★
(05.11.13 10:58:05 MSK)

Ответ на: комментарий от Deleted 05.11.13 08:40:18 MSK

1.В чем недостатки предложенного мною способа работы с полученным графом?

недостаток информации. Нехватает кластера «география»,«общественно-политическое устройство»,«история» etc. Если их все дополнить, то выйдет что проще прочитать оригиналы. хотя имея охватывающий граф вы можете написать продолжение ГП, или отдельный рассказ в том-же мире (см. писательский софт).

2.Если есть более оптимальный способ работы с полученным графом, то как он выглядит?

разве что возможность добавлять собственные семантические связи, кластеры и «заметки на полях». Как конспекты,закладки и шпаргалги IRL

3.Есть ли кроме графов другой, принципиально отличный способ структуирования знаний? И если да, то какой?

всё сводимо к графам.

MKuznetsov ★★★★★
(05.11.13 11:16:50 MSK)

Ответ на: комментарий от Dobriy_i_Prostoy 05.11.13 10:58:05 MSK

А что, MindMap умеет находить кратчайший путь в графах и все такое?

Deleted
(05.11.13 11:35:00 MSK)

Ответ на: комментарий от Deleted 05.11.13 09:49:04 MSK

Другое дело, что это СПРАВОЧНИК, а не учебник.

Ну так купи себе именно учебник. Там умные люди уже за тебя подобрали порядок изучения понятий.

Сложные вещи по справочникам выучить нереально. Точнее, реально, но просто потратишь кучу времени зря.

provaton ★★★★★
(05.11.13 11:36:48 MSK)

Ссылка

еще так: при прочтении первой статьи из списка, все, которые на нее ссылались, получают дополнительно (временный) буст 0,5-1,5 балла и, возможно, оказываются несколькими строчками выше. итд

MyTrooName ★★★★★
(05.11.13 11:49:38 MSK)

Ссылка

Ответ на: комментарий от Deleted 05.11.13 11:35:00 MSK

А что, MindMap умеет находить кратчайший путь в графах и все такое?

Еще скажи что тебе k means clustering, какой-нибудь, нужен. Дело в том что при подобном подходе у тебя каждое ребро графа будет нести некую семантику (описанный тобой тип организации знаний то давно известен), и в таком случае бессмысленными являются попытки что либо упорядочить автоматически(без добавления каких-либо правил дополнительных). Тема была когда-то достаточно популярна у всяких дядек с machine learning, поэтому гугли, читай, может чего родишь.

Но ты всегда можешь составить постой граф связанных понятий, решить на нём задачу коммивояжера, дабы не повторять пройденного, и все. Это единственное что я могу придумать

RedPossum ★★★★★
(05.11.13 12:00:52 MSK)

Ссылка

Ответ на: комментарий от MKuznetsov 05.11.13 11:16:50 MSK

см. писательский софт

А что, есть такой?

Xellos ★★★★★
(05.11.13 12:05:14 MSK)

Ответ на: комментарий от Xellos 05.11.13 12:05:14 MSK

Ну наверно не который прямо пишет, а некоего вспомогательного характера. Что бы не заблудиться в этих своих персонажах... Их же нынче модно делать много, как собак нерезанных. Количество писательского таланта компенсируется обилием персонажей и деталей.

sin_a ★★★★★
(05.11.13 12:11:42 MSK)

Формализовать задачу можно следующим образом: пусть имеются N статей, и L[i][j] = 1, если i-я статья ссылается на j-ю. Таким образом, L - матрица перекрестных ссылок. Далее предположим, что у любой статьи есть входящие ссылки. Пусть R[i] - степень понимания ранее прочитанной статьи i, от 0 до 1. И пусть чтение i-й статьи позволяет понять ее полностью или нет, в зависимости от числа ранее прочитанных статей, на которые она ссылается:

f(i) = b[i] + (1 - b[i]) * sum по j(w[j]*R[j])/sum по j(w[j]*L[j][i]), где 0<=f(i)<=1, для простоты линейная зависимость, b - уровень понимания статьи с 0 прочитанных ссылок, (1-b[i]) - нормировка, w[j] - некоторый весовой коэффициент.

Таким образом, понимание статьи основывается на определенных знаниях читателя, не связанных с целевой тематикой, и даже ничего не знающий по теме может понять b[i]-ю часть смысла. А прочтение каждой связанной тематической статьи добавляет к пониманию еще немножко. Повторяя процесс для разных статей, можно придти к полному пониманию. Для входа целесообразным является чтение статей, понятных неподготовленному читателю (большие b[i]) и имеющих много исходящих ссылок ( sum(L[i][j]) - велика ) и мало входящих ссылок ( sum[j][i] мала).

Задача сводится к тому, чтобы (видимо на основе экспертных оценок) выставить или как-то оценить коэффициенты и веса и далее упорядочить все статьи так, чтобы R(i)=1 для всех достигался при минимальном общем числе чтений. Алгоритм сейчас выдумывать лень.

amomymous ★★★
(05.11.13 12:11:54 MSK)
Последнее исправление: amomymous 05.11.13 12:12:46 MSK (всего исправлений: 1)

Ответ на: комментарий от sin_a 05.11.13 12:11:42 MSK

Ну мне вот было бы интересно поглядеть на такой тоже.

Xellos ★★★★★
(05.11.13 12:12:23 MSK)

Ответ на: комментарий от amomymous 05.11.13 12:11:54 MSK

Думаешь так намного лучше? :)

http://img-fotki.yandex.ru/get/9152/22277664.3/0_9081f_cd243056_orig

sin_a ★★★★★
(05.11.13 12:18:05 MSK)

Ответ на: комментарий от sin_a 05.11.13 12:18:05 MSK

Ну не могу я в лоркод, раньше не приходилось постить крупные куски текста с квадратными скобками.

amomymous ★★★
(05.11.13 12:21:13 MSK)

Ответ на: комментарий от amomymous 05.11.13 12:21:13 MSK

Для использовании в тексте тегов надо скобки писать два раза: [code]test[/code]. Возможно скобки в при любом использовании так надо. В описании разметки LORCODE это есть, в конце.

sin_a ★★★★★
(05.11.13 12:26:43 MSK)

Ответ на: комментарий от Xellos 05.11.13 12:12:23 MSK

Ну мне вот было бы интересно поглядеть на такой тоже.

раньше любопытствовал, насколько могу судить наиболее популярны и продвинуты (хоть и небесплатны)

http://www.writerscafe.co.uk/

https://www.literatureandlatte.com/scrivener.php

гугл также даёт обзор :

http://help.ubuntu.ru/fullcircle/30/писатель

тыщщи их, просто область применения далека от ЛОР`а и потому они тут малоизвестны :)

MKuznetsov ★★★★★
(05.11.13 12:33:05 MSK)

Ссылка

Ответ на: комментарий от sin_a 05.11.13 12:26:43 MSK

Спасибо, в следующий раз я буду знать. Стыдно, на самом деле, звезду давно заслужил, а писать скобки только сейчас учусь.

amomymous ★★★
(05.11.13 12:33:13 MSK)

Ссылка

Ответ на: комментарий от Deleted 05.11.13 11:35:00 MSK

MindMap — это ключевое слово для поиска, по которому можно найти информацию о том, как изучаются сложные системы.

Dobriy_i_Prostoy ★
(05.11.13 13:25:08 MSK)

Ответ на: комментарий от Dobriy_i_Prostoy 05.11.13 13:25:08 MSK

Вы уверены? Мне всегда казалось, что MindMap это не более, чем еще один вариант визуализации информации для менеджеров и прочих деловых сосисок. И что 99% пользователей MindMap скорее удавятся, чем пожелают слышать что-либо об графах, задаче коммивояжера и тому подобных вещах.

Deleted
(05.11.13 13:49:56 MSK)