Делал форму отправки SMS и озадачился вопросом о том, сколько символов умещается в одно сообщение. Думаете 160 латинских или 70 русских? А-ха-ха!
В SMS используется 7-битная кодировка, то есть таблица из 127 символов, включающая в себя все латинские символы ASCII и некоторые европейские с греческими, а также знак евро (€).
Но некоторые символы из этого «экранируются» и в итоге считаются за два символа, в общем случае вот этот набор: {}[]\|^~€
Для остальных символов используется кодировка UCS-2, устаревший вариант UTF-16.
Но и тут еще не все.