LINUX.ORG.RU
ФорумTalks

[loroogle] Программа для идентификации автора текста по характерным фразам. Такое бывает?

 


0

0

Сегодня мне рассказывали что есть такая программа (а может и комплекс или т.п.), которая может по характерным фразам в сети находит тексты того же автора.
Т.е. этой байде скармливается некий текст, она определяет характерные фразы, а потом в сети (наверное можно и по другим текстам) находит тексты того же автора.
Рассказывал мне человек на котором ее применяли так сказать. Он пишет статьи, некоторые из них он публикует под псевдонимами. Так вот его знакомый показывал результат работы такой программы, т.е. по тексту (по характерным фразам) нашел другие его статьи, опубликованные под псевдонимами в интернете.

Собственно меня интересует:
Есть ли такие алгоритмы (и их реализации) для установления авторства текста на основе его сравнения?

P.S. Подробностей не знаю. Есть вероятность что вообще фейк.

★★★★★

Есть I Write Like, который, правда, сравнивает только текст на английском и только с ограниченным набором (относительно известных) авторов. Напиши им, спроси, как делали.

opkdx
()

Записал: выработать устойчивое умножение личности для невозможности идентификации.

Yareg ★★★
()
Ответ на: комментарий от sS

I write like H. P. Lovecraft

Это кто вообще ? :)

Это тот, кто придумал Ктулху (и не только его) =).

Deleted
()
Ответ на: комментарий от sS

Гы :)

Прошлогодний отчёт I write like Dan Brown

Этого знаю :)

sS ★★★★★
()
Ответ на: комментарий от sS

> Прикольная штука. Сунул туда абзац из своей статьи - выдал



I write like


H. P. Lovecraft



скопировал туда их же текст над полем ввода - выдало того же «H. P. Lovecraft»

ahonimous
()
Ответ на: комментарий от sS

Но автора идентифицирует кстати стабильно. Разные куски отчёта писаны разными людьми и оно это фиксирует (коллега пишет как Артур Кларк)

sS ★★★★★
()

по поводу этих тестов слышал два типа мнений. Первое, «авторское», гласит, что при хороших алгоритмах достигается угадывание автора в 95%. Второе, «пользовательское», гласит, что при попытке поиска по большой базе имеющиеся алгоритмы сливают свои способности угадывания в никуда. И те алгоритмы, о которых я слышал, держатся в секрете , типа, ведь если мы их откроем, то всем станет ясно, что за Пушкина писал Вася Пупкин (вот, sS писал и за Лавкрафта, и за Брауна).

spunky ★★
()

Собственно меня интересует: Есть ли такие алгоритмы (и их реализации) для установления авторства текста на основе его сравнения?

хм, вопрос задан некорректно, программа не может установить авторство потому что она не знает что это такое :) скорее уж можно определить процент совпадения текстов (с учётом стилистических, лексических и прочих особенностей)

проверяют же студентов чтобы код друг у друга не подрезали и сами делали :)

shty ★★★★★
()

В одной из серий сериала Теория лжи определили, что автор предсмертной записки является властная женщина. Определили по используемым словам. Например пол определили по слишком большому использованию местоимений.

bbk123 ★★★★★
()
Ответ на: комментарий от pi11

>Остлось попробовать скормить произведения Лавкрафта интерпретатору perl.

Вот теперь я точно знаю как пробудить Ктулху, мухаха!

kranky ★★★★★
()
Ответ на: комментарий от anon_666

>Мнея не пропалите хехе

write like
Stephen King :))

sS ★★★★★
()

курить, например, это, это и это.

один из вариантов - считать главный предложный спектр (количество предлогов «в», «на», «с»), количество предлогов на 1000 слов фиксируется на графике. графики разных текстов одного автора должны быть похожи.

// «мопед не мой», я просто где-то это читал)

nisdevi
()

Воодушевившийся друг написал следующее:

When i was twelve I wanted to fuck my dog. I've never thought that my dreams were awful and full of sickness. Only pure kid's dream. But the cruel real life broke my dream. When i tried to do this my dog this fucking animal byte my balls and now i can't fuck anything. Sad but true.

I write like David Foster Wallace

вопрос - что за извращенец этот Уоллес?

jcd ★★★★★
()
Ответ на: комментарий от jcd

I'm great Cornholio! Don't make my anus to be cruel! I need a paper! I'm Cornholio!

I write like Chuck Palahniuk

ну совсем не удивлён

jcd ★★★★★
()
Ответ на: комментарий от simple_best_world_web_master

дай угадаю

наверное по фразе «мой тулкит»

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.