LINUX.ORG.RU

Перевод и анализ текстов


0

0

Посоветуйте различный софт для перевода, анализа текстов (в частности интересует подсчет количества вхождений каждого слова в текст), изучения языков и тд.
В общем различные программы, которые помогут переводчикам и людям, изучающим язык.
Что уже есть (чтобы очевидное не писать):
goldendict, anki, omegaT, wordnet (+ artha).

Может кто-нибудь занимается переводами? Что и как используете для этого?

★★★★★

Постоянно перевожу, пользуюсь оффлайновым stardict и некоторыми онлайновыми словарями (не только двуязычными). Нахрена переводчику нужен подсчёт вхождений каждого слова в текст, мне лично непонятно. Разве что контролировать себя на предмет слов-паразитов.

AP ★★★★★
()
Ответ на: комментарий от AP

Для терминологии может пригодится сначала определиться с тем как и какой термин переводится в каком контексте. И если переводишь только часть придётся анализировать всё что перевели до тебя?

psv1967 ★★★★★
()

Зачем подсчет слов в тексте? Ну, допустим, чтобы проанализировать несколько текстов и найти незнакомые, но более-менее часто встречаемые слова.

kovrik ★★★★★
() автор топика
Ответ на: комментарий от AP

а вот это по подробнее, а то я даже не знаю по каким словам гуглить. очень хочется от gtkшной морды стардикта избавиться, консольная версия слишком убогая, а вот встроенный словарик в емаксе был бы кстати

thunar ★★★★★
()
Ответ на: комментарий от thunar

попробовал

M-x dict стоя курсором на слове --- даёт окно с информацией из всех онлайновых словарей к которым может дотянуться. Наверное можно настроить на локальный сервер.

есть M-x

Possible completions are: dict    dict-display-version    dict-mode dict-multiple    dict-on-server    dict-region dict-show-similar    dict-version

psv1967 ★★★★★
()

Prawda - отечественных open source переводчик. Не развивается в 2006 года, но может пригодится.

Sociopsih ★☆
()

StarDict имеет интегрированный переводчик, а также плагины, например построение графа слова по отношению к чему-то там.

Quasar ★★★★★
()

в частности интересует подсчет количества вхождений каждого слова в текст

Это довольно простая задача. Вот упрощенная реализация на haskell для plain text:

import System
import Data.Char
import Data.List
import qualified Data.Map as Map
import qualified System.IO.UTF8 as UTF8

toList file = map (map toLower) $ map (filter isAlpha) $ words file

countEntries file = Map.toList $ Map.fromListWith (+) $ zip (toList file) $ repeat 1

sortEntries entries = sort $ [(x,y)|(y,x) <- entries]

showEntries entries = unlines $ [unwords [show x, y]| (x,y)  <- sortEntries entries]

main = do 
  args <- getArgs
  file <- UTF8.readFile $ head args
  UTF8.putStr $ showEntries $ countEntries file
Первый аргумент программы - название текстового файла. На выходе - список слов, отсортированный по количеству вхождений.

gorky ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.