1、常用编码介绍
(1)ASCII码表,只有0-127,128位,使用了一个字节的低7位,剩余的128位作为扩展
(2)ISO-8859-*使用了ASCII码剩余的128位作为扩展,常用:ISO-8859-1
(3)GB2312 中文简体字集,包含6763个简体中文字
(4)Big5大五码,繁体字集
(5)Unicode统一字符集,简称UCS
(6)GBK包含GB2312和Big5简繁字集,向下完全兼容GB2312,使用GBK打开GB2312的文本不会乱码,共21003个字符
(7)UTF-8万国码,包含世界所有国家的字符
2、ASCII码表
常用:0-9 A-Z a-z 分别对应ASCII码的48-57 、65-90 、97-122
3、乱码产生原因
计算机中文件的存储都是以二进制的形式保存的,在保存到硬盘上时,计算机会将内存中的文件,按照特定的格式[编码方式]转换为二进制文件,保存到硬盘中; 当文件再次打开时,计算机会把硬盘中的二进制文件加载到内存,按照特定的格式,重新编码成可读的普通文件; 重新编码时,系统会搜索当前系统中,对于不同后缀名文件的默认打开方式[每种打开方式包含的编码不一定相同],如果默认的打开方式中包含的编码方式与原编码格式相同,则文件可以正常打开,没有乱码;
4、解决乱码
在保存文件时,确定编辑保存的编码方式 在打开文件时,要根据不同的文件后缀名,选择对应的打开方式
5、notepad++等记事本中的乱码问题
编写一段文本,使用UTF-8编码格式进行保存; 打开时选用不同的编码方式查看显示的效果