Есть текст сообщений.
Вопрос: можно ли извлечь «факты» в «нормализованной форме» из такого текста с помощью автоматизированного лингвистического анализа? Тематика узкая - фитнес.
Извлекать нужно: виды упражнений, информацию о питании, вес (массу), время
Или лучше regexов понаписать и поиск по известным словам?
Сообщения такого плана:
- Вес 56 килограммов.
- Взвесился 65 килограмм
- Взвесилась только что, 54 кило
- Масса 65 килограмм
- Пожал 90, два подхода по 8 раз.
- Сегодня в обед съела салат из томатов и огурцов со сметаной, чай, бутерброд с колбасой
- Прием пищи: макароны по-флотски, чай, суп с фрикадельками
- Вчера съела торт кремовый две тарелки
- Съел салат весенний 200 грамм. В нём 200 килокалорий на 100 граммов.
- Съел утром 200 килокалорий
- Вечером на обед были язычки колибри. В них 80 грамм углеводов, 10 граммов белка, жиров 5 грамм и 2 гр. золы. Всего 36 калорий
- Манная каша - 56 калорий
- жим лежа 60 пять по шесть
- эллипс 8 минут за 7.55
- блок пять по десять 45,45,45,45,40
- трицепс 40кг 3 по 10
- жим пустой гриф 1 на 30
- приседы 3х6 60кг + 2х6 65кг