Решил я в довесок к тегам тоже самое сделать со словами. Т.е. посчитать какие и сколько слова употреблялись в титле толксов. после получения результата - данные разительно не сошлись с тем что дают тэги.
А теперь самый, наверное, главный прикол:
grep "INSERT INTO worddict (\`id\`,\`wordname\`) VALUES (NULL,'жж');" words-db |wc -l
709
mysql> select count(id) from worddict where wordname='жж';
+-----------+
| count(id) |
+-----------+
| 181 |
+-----------+
1 row in set (0.05 sec)
(words-db - дамп бля базы чтобы потом можно было посчитать уже через неё)
и как это понимать?