LINUX.ORG.RU
ФорумTalks

Просьба — пополните словарь бота


0

1

Пополните пожалуйста словарь бота (пока я граббер пишу к словарям «кисы»). Для пополнения, напишите тут пост сформатированый для словаря (используя спец-синтаксис как в примере). Форматировать так:

Фраза боту>Возможный вариант ответа.|Второй вариант|И так далее...;



Последнее исправление: makeB (всего исправлений: 2)

Флибуста тебе в помощь. Бери авторов, у которых много диалогов, и наваяй скриптец для парсинга.

abraziv_whiskey ★★★★★
()

Это ты там в треде про конкурс тем для е17 сказал, что денег в призовом фонде мало? А мы тебе бесплатно забивать словарь будем? Ага!11

cdshines ★★★★★
()
Ответ на: комментарий от cdshines

Это ты там в треде про конкурс тем для е17 сказал, что денег в призовом фонде мало?

Я предложил там свои мысли, что целесообразнее заказать, нежели устраивать конкурс, в котором три калеки разве что участвовать будут. И что хочешь сказать, я не прав оказался?

makeB
() автор топика
Ответ на: комментарий от abraziv_whiskey

Бери авторов, у которых много диалогов, и наваяй скриптец для парсинга.

Пишу уже граббинг словарей «кисы», но лоро-специфичный сленг, манер общения тоже не помешает :]

makeB
() автор топика
Ответ на: комментарий от makeB

Так там все было не с целью заполучить, наконец-то, идеальную тему. А просто спортивный интерес. Да и вообще интерес - каждый крикун в галерее с е17 орет «е17 готов для десктопа», а заглянешь - хуже, чем windowblinds, честное слово.

cdshines ★★★★★
()
Последнее исправление: cdshines (всего исправлений: 1)

Эта штука должна быть онлайновой. Тогда базу тебе быстро наполнят. А вообще такие боты малоинтересны. Для нормального бота надо:

  • юзать синтаксический анализатор для разбора предложения по составу.
  • сверять всё это со словарём синонимов
  • хранить эмоциональное состояние бота и тематику разговора
  • хранить базу уже доступных знаний

Вот такой бот, эмоциональный, умеющий оперировать фактами и ловить на лжи, уже мог бы попытаться пройти известный тест. Но в такую штуку надо было бы вложить очень много человекочасов.

Sadler ★★★
()
Ответ на: комментарий от cdshines

А просто спортивный интерес.

Спортивный интерес кого, программистов? На е17 дизайнеров вряд ли встретишь, о чем я собственно и говорил, так что большого смысла в конкурсе не было. Или ты настолько позитивный, что думаешь, мол дизайнер ради конкурса поставит е17?

makeB
() автор топика
Ответ на: комментарий от makeB

лоро-специфичный сленг, манер общения тоже не помешает :]

*>Ненужно.|Язабан.|При чём тут линукс?;
/thread

aidaho ★★★★★
()
Ответ на: комментарий от cdshines

каждый крикун в галерее с е17 орет «е17 готов для десктопа», а заглянешь - хуже

А это уже фломастеры разные, и в конкурсе было бы тоже самое. Ну и да, покажи хоть примеры того, что считаешь симпатичным, удобным дизайном, к которому е17 по твоему мнению надо бы стремиться.

makeB
() автор топика

Свалочку же пограбь, лютый бот выйдет! свалко.орг

abraziv_whiskey ★★★★★
()
Ответ на: комментарий от Sadler

Вот такой бот, эмоциональный, умеющий оперировать фактами и ловить на лжи, уже мог бы попытаться пройти известный тест. Но в такую штуку надо было бы вложить очень много человекочасов.

Да не, у меня задача попроще будет, создать болталку для игры и не более, такой тупой как сейчас вполне достаточно, надо бы только словарь общий составить, из которого бот либо расспрашивает если не знает что ему написали, либо отвечает заложенными словами, либо рассказывает о себе если спрашивали.

makeB
() автор топика

Просьба — пополните словарь бота
Фраза боту>Возможный вариант ответа.|Второй вариант|И так далее...;

challenge accepted:

Вышла новая проприетарная свистоперделка>Не нужно|арабство|зачем это здесь?
Наших программистов притесняют>танцпол;
У меня тут идея появилась>где тег "вещества"?|Не нужно|велосипед?|выдыхай|язабан;
Вышел новый дистрибутив *>а чем оно лучше генты?|болгенос|не нужно|зоопарк|язабан;
Вышел новый текстовый редактор *>не нужно|emacs наше всё|vim наше всё|до M$V$ всё равно не дотягивает;
Вышел новый язык программирования *>опять нефункциональное говно|опять функциональное говно|не лисп, значит, не нужно|не жаба, значит, не нужно;
Плазма не падает>4.2;
Помогите с арчем>ставь генту|школолопроблемы;
Помогите с убунтой>ставь слаку|вали на венду|ставь генту|школолопроблемы;
Помогите с прогой *>УМВР, ЧЯДНТ?|это же говно мамонта|тебя Поттеринг укусил?|ставь генту|RTFM|на гугле забанили?;
Новая эпидемия вируса *>язабан|пох|зачем это здесь?;

Думаю, направление понятно.

border-radius
()
Ответ на: комментарий от vasya_pupkin

Ну и в самом деле, ответы большинства здесь подходят под типичный ботский паттерн.

border-radius
()

Все, граббер словарей кисы готов, гхм правда на php, на нем просто легче было написать:

<?php
//ГРАББЕР СЛОВАРЕЙ ЧАТ-БОТА КИСЫ
//Подключаем парсер http://simplehtmldom.sourceforge.net/
include_once('simple_html_dom.php');

//Загружаем xml-словарь кисы
$html = file_get_html("SearchLoadTab.xml");

//Сохраним результат в словарь scb
$savefile = "data.txt";

//Парсим
$i = 0;
foreach($html->find('m') as $m) {
$i++;
foreach($m->find('ms') as $ms) {
file_put_contents ( $savefile, $ms->href ./*"$i — ".*/ $ms->innertext. ">", FILE_APPEND | LOCK_EX);
echo $ms->href ./*"$i — ".*/ $ms->innertext. ">";
$ii = 0;
foreach($m->find('t') as $t) {
$ii++;
if ($ii >1) {
file_put_contents ( $savefile, $t->href ."|". $t->innertext. "", FILE_APPEND | LOCK_EX);
echo $t->href ."|". $t->innertext. "";
}
else {
file_put_contents ( $savefile, $t->href ."". $t->innertext. "", FILE_APPEND | LOCK_EX);
echo $t->href ."". $t->innertext. "";
}
}
file_put_contents ( $savefile, ";\n", FILE_APPEND | LOCK_EX);
echo ";<br>";
}
echo "<br>";
}
?>

makeB
() автор топика
Ответ на: комментарий от makeB

Во, теперь со словарем прокачанным болтает неплохо :]

makeB
() автор топика

почему нельзя делать фраза боту|вариант фразы|так далее...>ответ|второй вариант|так далее...?

jeuta ★★★★
()
Ответ на: комментарий от jeuta

почему нельзя делать

Можно, точнее что-то вроде этого и будет, но со временем.

makeB
() автор топика

Пополните пожалуйста словарь бота

Назови бота Эллочкой и проблема решается сразу.

devl547 ★★★★★
()
Ответ на: комментарий от makeB

граббинг, а посмотреть сырцы js'ки и сделать несколько раз cut && grep религия запрещает?

AiFiLTr0 ★★★★★
()
Ответ на: комментарий от makeB

русско-говорящего

Конечно нет. И пишется слитно.

LMD
()
Ответ на: комментарий от makeB

но лоро-специфичный сленг, манер общения тоже не помешает

тут одни тоже недавно обучили контупер сленгу с урбандикшинари, потом форматировать пришлось, а то сильно дерзкий стал...

SOmni ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.