计算机常用编码

    技术2022-07-10  147

    1、常用编码介绍

    (1)ASCII码表,只有0-127,128位,使用了一个字节的低7位,剩余的128位作为扩展

    (2)ISO-8859-*使用了ASCII码剩余的128位作为扩展,常用:ISO-8859-1

    (3)GB2312 中文简体字集,包含6763个简体中文字

    (4)Big5大五码,繁体字集

    (5)Unicode统一字符集,简称UCS

    (6)GBK包含GB2312和Big5简繁字集,向下完全兼容GB2312,使用GBK打开GB2312的文本不会乱码,共21003个字符

    (7)UTF-8万国码,包含世界所有国家的字符

    2、ASCII码表

    常用:0-9 A-Z a-z 分别对应ASCII码的48-57 、65-90 、97-122

    3、乱码产生原因

    计算机中文件的存储都是以二进制的形式保存的,在保存到硬盘上时,计算机会将内存中的文件,按照特定的格式[编码方式]转换为二进制文件,保存到硬盘中; 当文件再次打开时,计算机会把硬盘中的二进制文件加载到内存,按照特定的格式,重新编码成可读的普通文件; 重新编码时,系统会搜索当前系统中,对于不同后缀名文件的默认打开方式[每种打开方式包含的编码不一定相同],如果默认的打开方式中包含的编码方式与原编码格式相同,则文件可以正常打开,没有乱码;

    4、解决乱码

    在保存文件时,确定编辑保存的编码方式 在打开文件时,要根据不同的文件后缀名,选择对应的打开方式

    5、notepad++等记事本中的乱码问题

    编写一段文本,使用UTF-8编码格式进行保存; 打开时选用不同的编码方式查看显示的效果

    Processed: 0.034, SQL: 9