Как имена разбивать собрался? Саша это чьё имя? Мужское или женское?
Саша - это уменьшительно-ласкательное от Александр/Александра
также как Вася - Василий/Василина, ... Виталий/Виталина и пр.
з.ы. Александра Серая или Александр Серый ...
кстати, если м:Серый то ж:Серая
но если будет какой-то Серий, то это Серий в обоих вариантах
также если у самого слова есть женский род, то это не значит что у фамилии он есть, Ворон например
ткчто, как я думал, программно не получится запилить
да и про словари такие я не слышал
чуваки составляли его несколько лет из OSM, но с именами я думаю будет проще и можно сделать достаточно полный за несколько дней на базе какого-нибудь телефонного справочника, той же википедии.
А для чего нужно, для генерёжки или детектирования имён? Если первое, большой словарь не нужен, можно за пару часов слепить. Если второе, в любом случае его нужно постоянно пополнять по входным данным.
Мы когда дочке выдумывали имя, перелопатили кучу сайтов. Но так и не нашли вменяемого списка имен! Везде какие-нибудь кастрированные. Скажем, только еврейские, или только славянские, или только германские. И то, не все, а наиболее распространенная часть.
Хотя, у них же там только склонение реализовано. Навряд ли тебе нужно конкретно и только это. Если-таки да, посмотри на http://petrovich.rocketscience.it
Есть небольшой словарь ФИО в виде электронной таблицы в виде:
укр. | рус. | пол
Но все только в именительном падеже. Если нужно, то угощайтесь:
https://copy.com/Q0xqQA1QZ0uPswXq