Потому что это не символы, а картинки. А между прочим места в юникоде не так уж и много. Раньше вообще лимит был 65536, теперь его расширили, но он всё ещё весьма ограничен и вполне может кончиться, если вносить туда всякую хню, не являющуюся символами.
Ну а ты как хотел? Но по-моему это ключевой признак. Если распознавание идёт по ассоциациям и непосредственно — то это скорее картинка, если распознавание использует символьную память — то это уже другое дело.
Например + именно символ, так как его значение неочевидно из вида символа, пятиконечная звезда скорее всего тоже символ, так как его значение распознаётся из контекста и требует знаний.
А вот улыбающиеся рожицы распознаются как есть, не требуя предварительного обучения, поэтому их правильнее отнести к картинкам и обращаться соответственно.
А вот объясни мне, мил-человек, как ты такой URL собираешься диктовать по телефону, например?
Да что там по телефону - даже просто воспроизвести его на клавиатуре, если он прислан не в электронном, а в печатном виде — задача крайне нетривиальная.
как ты такой URL собираешься диктовать по телефону, например?
Элементарно, Ватсон: «ха-ха-тэ-тэ-пэ двоеточие два слэша клубника кукуруза какая-то голубая фигня найдёшь сам ещё какая-то жёлтая фигня ракета мячик или горох ракетка тёмная фигня баклажан точка колпак мастер хэнки точка дабл-у эс.» А можно вставить в браузерную адресную строку и получить перекодировку, которую и продиктовать: http://xn--qg8hfde6azd70b68a0zj.xn--vi8hiv.ws/ . Перевод получился не намного хуже оригинала в плане зубодробильности.
В общем, настоящему фанату своего дела трудности нипочём. :-)