LINUX.ORG.RU

Анализ тональности текстов на русском языке

 ,


0

3

Доброго времени суток! Занимаюсь изучением тональности русскоязычных публикаций СМИ, методами машинного обучение. Требуется множество (>50000 хотя бы) размеченных русскоязычных публикаций СМИ (позитивные и негативные). Возможно кто то вел работы по этому направлению или знает источники, где таковые наборы имеются. Буду признателен за информацию)


Это скорее шутка, но мало ли...

Возможно кто то вел работы по этому направлению или знает источники, где таковые наборы имеются.

http://breakingmad.me/ - там сверху можно выбрать страшное/смешное/странное =).

Жалко что обновлять перестали.

Deleted
()

Есть такой анекдот

Сидят на счету студенты на лекции. Лектор им говорит что ни в одном языке два положительных слово подряд не формируют отрицательного утверждения. Голос с задних рядов: Да конечно

ckotinko ☆☆☆
()

А вообще, заходи на ИноСМИ. Жалко глюксман умер, эталонный был урод. Мы в честь его единицу измерения злобного бреда назвали: глюк. Самому глюксман давали 0.99 глюка, чтоб старому ублюдку было куда расти. А так там негативных текстов- хоть жопой жуй.

ckotinko ☆☆☆
()
Ответ на: комментарий от ckotinko

глюксман умер, эталонный был урод

Есть восходящие «звезды»? А то чето дохнут «лучшие». Впрочем, это политота и наверное не стоит.

I-Love-Microsoft ★★★★★
()
Ответ на: комментарий от ilovewindows

хорошая работа, но там собраны комментарии с твиттера, которые имеют весьма своевольную стилистику и не очень применимы для анализаторы тональности новостных публикаций, на мой взгляд. хотя конечно можно попробовать обучить сеть на этом корпусе и посмотреть как он будет реагировать на публикации СМИ, имеющие более деловой стиль изложения

iamsia
() автор топика
Ответ на: комментарий от anonymous

это одна из задач контент-анализа, которая имеет обширный ряд применений, полезных для специалистов, занимающихся аналитической деятельностью. кроме того это одна из задач машинного обучение, которое в свою очередь применений имеет неимоверное множество

iamsia
() автор топика
Ответ на: комментарий от I-Love-Microsoft

да он лох теперь.

я помню что он «исписался», ему даже 0.5 глюка давали. ненадолго всплыл какой-то американский то ли полковник, то ли генерал, который жёг, но он сука жёг суконно, и где-то на 0.6 глк. Не цепляло.

Я когда первый раз прочитал глюксмана, я просто час или два сидел как будто мешком по голове ударили: Как можно так ненавидеть. Вот тебя ненавидит человек просто так. Ты ему ничего не сделал а он ненавидит аж светится. Статья кстати называлась «день D». А потом привык и даже скучал, когда статьи глюксмана слишком долго не выходили. Обычная писанина после глюксмана просто не вставляла: скучно. Плохо ненавидите, старайтесь лучше.

Затем я много лет не читал иносми, в ЖЖ бурлило жырнее.

Так вот, где-то после 2010, когда бунт глистов слился, это говно ненадолго ожило и сдохло. А вот где-то в декабре 2013го там уже был аншлаг. А потом был крым и сперва проперло украинцев. Два месяца они говорили так, как будто им пентатал натрия кололи. Я это видел в реальном времени. И где-то к маю 2014го началось уже какое-то приходение в сознание, и попытки «мышебратства» и прочей пропаганды. И то же самое мы видели в западных СМИ. Грубо говоря, все прозападные резко расхечлились от удара по яйцам.

И после этого западные СМИ просто уделывают глюксмана в ништо. Есть в жж panchul, он кстати украинец. Так вот, он вата. Он охерел как-то от поста в вошпосте помоему, и даже и сам туда отписался в коменты что это ridiculous, и размножил это постом. Тогда, в 2014м, этот пост в вашпосте казался запредельной хуцпой в сравнении с глюксманом из 2004го. А глюксман был запредельной хуцпой в сравнении с всеми остальными тогда еще в 2004м.

Сейчас, в 2018м, после газа «дурачок», после вообще всей этой упоротой хуцпы, та статья кажется «адекватной», Это экспонента: они скоро будут в знак протеста в очко долбиться на ютубе просто я уже не знаю куда днищнее.

ckotinko ☆☆☆
()
Ответ на: комментарий от ckotinko

Кажется теперь я понимаю от чего в тебе столько ненависти ко всему. Потреблять такое регулярно... уффф...

Deleted
()
Ответ на: комментарий от ckotinko

Сидел Иванушка-дурачок и читал всю проплаченную хуцпу в интернетах. Год читал, два читал, десять лет... А потом его в психушку забрали. А глюксман совсем помер, потому что работа была вредная - доставлять Иванушке хуцпу. А дурналисты мериканские не болеют, за них хуцпу Иванушке доставляет нейросеть. Слава роботам!

anonymous
()
Ответ на: комментарий от Deleted

Если честно, я тоже такое читал очень плотно, когда это было еще с огоньком.

Фантастическое хохлячье предательство неблагодарность и тупость, животная ничем существенно необоснованная бесконечная ненависть к РФ - это было угарно читать. Они немного начали понимать что долги перед МВФ и продажа земли это не шутки, что конкуренция с ЕС может поставить крест на их промышленности, а отток рабочей силы это то, о чем вата их предупреждала. Вот после этого читать стало скучно.

Так что это хороший ценный материал для оценки тональности.

I-Love-Microsoft ★★★★★
()
Ответ на: комментарий от ckotinko

два положительных слово подряд не формируют отрицательного утверждения. Голос с задних рядов: Да конечно

Ну так здесь отрицательность придает интонация, а не сами слова.

Nervous ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

Еще один рязанский ваня, озабоченный положением хохлов. Вместо того чтобы рязань свою от говен вычищать сидит кумекает про конкуренцию с ЕС. Где вас таких штампуют, дурошлепов. Рязанский завод высокоточных совков?

anonymous
()
Ответ на: комментарий от anonymous

Вместо того чтобы рязань свою от говен вычищать

Поверь мне, на вас клоунов, давным давно наплевать. Так что не беспокойся за нас. Зато ваши гастеры много мне рассказали, пока вычищали.

I-Love-Microsoft ★★★★★
()

Тональность определяется по ключевым знакам и последней ноте.

Sorcerer ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.