GB和GBK都是用于汉字编码的标准,但它们之间存在一些关键的区别。
首先,GB,全称GB2312或GB2312-80,是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集——基本集》。它主要收录了6763个汉字,并进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码,主要用于输出简体中文。
而GBK,全名为汉字内码扩展规范,英文名Chinese Internal Code Specification,其中K是“扩展”所对应的汉语拼音中“扩”字的声母。GBK是在GB2312-80的基础上进行了扩展,不仅收录了GB2312中的所有汉字,还涵盖了原Unicode中所有的汉字,总共收录了21003个汉字,并提供了造字码位。因此,GBK不仅可以输出简体中文,还可以输出繁体中文。
此外,GBK还向下与GB 2312编码兼容,向上支持ISO 10646.1国际标准,是GB 2312向ISO 10646.1过渡过程中的一个承上启下的标准。
总的来说,GB和GBK的主要区别在于它们的收录汉字规模、输出格式以及与其他标准的兼容性。在选择使用哪种编码标准时,需要根据具体的应用场景和需求进行考虑。
GB和BB都是计算机存储容量单位,其中GB(Gigabyte)表示吉字节,而BB(Brontobyte)表示一千亿亿亿字节。在这两个单位中,BB比GB大,具体换算关系如下:
1BB=1024YB
1YB=1024ZB
1ZB=1024EB
1EB=1024PB
1PB=1024TB
1TB=1024GB
因此,BB是比GB更大的存储容量单位。
1. 字符集范围:GB2312最多包含6763个汉字和682个非汉字字符,而GBK则包含21003个汉字和882个非汉字字符。因此,在GBK字符集中,包含了更多的生僻字和方言字。
2. 编码方式:在GB2312中,每个汉字由两个字节组成,一般的符号和数字等由一个字节组成;而在GBK中,汉字可以使用1~2个字节来表示,而其他字符则使用1个字节。因此,GBK比GB2312在多字节编码的方面更灵活。
3. 兼容性: GBK全面兼容GB2312,GB2312之前设计的软硬件环境中可以使用GBK字符集,但GBK之后设计的环境不支持GB2312字符集,需要进行转换。