Есть множество значений. Некоторые значения в этом множестве повторяются, ну или большинство. Процент одного из значений в этом множестве составляет k/n, где k это количество этого значения, а n это размер множества. Если количество различных значений m, то формула такая (во избежания разночтений пусть будет С++ код):
double su = 0;
for (int i = 0; i < m; ++i)
su += pow(static_cast<double>(k[i])/n, 2);
double result = sqrt(su);
Результатное значение такой формулы всегда больше нуля и меньше или равно единицы. Имеет ли это какое-либо обособленное название в математике?
=========================================
В общем это один из вариантов коэффициента Gini Impurity. Еще вариант такого коэффициента это такая сумма вероятностей Sum( p[i] * (1 - p[i]) ).