GBK编码,一个汉字占两个字节。UTF-16编码,通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16)。UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节。
取决于实现unicode的用的什么编码,如果utf8的话是变化字节,字节范围1-6有可能,绝大多数字符1-3,当然汉字绝大多数3个字节,少数4字节。
utf 32字节不变,所有unicode字符都是4字节。
utf 16的话都是2字节或者4字节,固定和可变结合的