<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[沧海一粟]]></title> 
<link>http://www.dzhope.com/index.php</link> 
<description><![CDATA[Web系统架构与服务器运维,php开发]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[沧海一粟]]></copyright>
<item>
<link>http://www.dzhope.com/post//</link>
<title><![CDATA[关于GB编码的一些常识]]></title> 
<author>jed &lt;jed521@163.com&gt;</author>
<category><![CDATA[代码编程]]></category>
<pubDate>Thu, 12 Oct 2006 00:35:12 +0000</pubDate> 
<guid>http://www.dzhope.com/post//</guid> 
<description>
<![CDATA[ 
	GB编码标准中，比较常用的是GB2312和GBK两种，GB2312是GBK的一个子集，GB2312编码范围是 0xA1A1 - 0xFEFE ，如果纯粹的 GB2312编码，处理起来是什分简单的，但处理GBK字符集时有些小的提示，先说说GBK编码的标准吧： <br/><br/>GBK 采用双字节表示，总体编码范围为 8140-FEFE，首字节在 81-FE 之间，尾字节在 40-FE 之间，剔除 xx7F 一条线。总计 23940 个码位，共收入 21886 个汉字和图形符号，其中汉字（包括部首和构件）21003 个，图形符号 883 个。 <br/><br/>全部编码分为三大部分： <br/><br/>1. 汉字区。包括： <br/><br/>a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个，按原顺序排列。<br/>b. GB 13000.1 扩充汉字区。包括：<br/>(1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。<br/>(2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。<br/>CJK 汉字在前，按 UCS 代码大小排列；增补的汉字（包括部首和构件）在后，按《康熙字典》的页码／字位排列。 <br/><br/>2. 图形符号区。包括： <br/><br/>a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外，<br/>还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。<br/>b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。 <br/><br/>3. 用户自定义区：分为(1)(2)(3)三个小区。 <br/><br/>(1) AAA1-AFFE，码位 564 个。<br/>(2) F8A1-FEFE，码位 658 个。<br/>(3) A140-A7A0，码位 672 个。<br/>第(3)区尽管对用户开放，但限制使用，因为不排除未来在此区域增补新字符的可能性。 <br/><br/>这里有几个小技巧： <br/><br/>一、在php中，字符编码是按所发送的编码为准的，因些使用的就是用户输入的编码，不会自动改变，但在asp中，默认的编码是unicode，这样我们很容易就能得到gbk->unicode的编码对照表，这样即使在毫无基础库的情况下也能很容易的实现gbk到utf-8的转换了； <br/><br/>二、由于GBK是高位最低数值是0x40，即是64，因此，有时候组织一些涉及中文的字串时，分割字符最好用64之前的ascii码，这样在任意情况下替换或分割都不会出现乱码，比较常用的是 ","、";"、":"、" "、" "、" "，这些字符永远都不会给gb编码添乱。 <br/><br/><br/><br/><br/><br/><br/>Tags - <a href="http://www.dzhope.com/tags/gb%25E7%25BC%2596%25E7%25A0%2581/" rel="tag">gb编码</a>
]]>
</description>
</item><item>
<link>http://www.dzhope.com/post//#blogcomment</link>
<title><![CDATA[[评论] 关于GB编码的一些常识]]></title> 
<author> &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate> 
<guid>http://www.dzhope.com/post//#blogcomment</guid> 
<description>
<![CDATA[ 
	
]]>
</description>
</item>
</channel>
</rss>