代码测试吧 关注:138贴子:3,524

繁体字代码原理讲解

只看楼主收藏回复

首先 我们使用了繁体字代码后

这些数字是怎麼回事呢
其实 这要从UNICODE讲起了


IP属地:湖南1楼2014-12-03 18:22回复
    我们先来看

    一到网上找"汉字转UNICODE"之类的 转出来的是揵揶 错了 我打的不是这个
    像什麼汉字转UNICODE什麼的啊 其实是以UTF-16为基础的 而不是以纯正的UNICODE码为基础的


    IP属地:湖南2楼2014-12-03 18:28
    收起回复
      2025-07-31 00:25:28
      广告
      不感兴趣
      开通SVIP免广告
      十进制中的156661是十六进制的263F5
      十进制中的156662是十六进制的263F6
      UNICODE中的263F5和263F6对应的是......
      𦏵和𦏶
      这麼说 繁体字代码是以UNICODE为基础的了
      那麼为什麼直接打𦏵和𦏶没用呢


      IP属地:湖南3楼2014-12-03 18:32
      回复
        可能是百度把𦏵之类的转码了
        如果是这样的话 繁体字代码可能是将字符转成类似于𦏵的十进制UNICODE值后
        不让百度转码


        IP属地:湖南4楼2014-12-03 18:36
        回复
          我想 百度转码的可能性很大 我们做这个实验来证明:
          如果没经过特殊转码话 浏览器是可以把这类十进制UNICODE转换为文字的
          我们把一个HTML文件修改成这样

          浏览器打开后


          IP属地:湖南5楼2014-12-03 18:48
          回复
            即使这个html文件用什麼编码方式都会有同样的效果(特殊编码除外)
            UTF-16BE也好啊 UTF-8也好啊反正都是这样


            IP属地:湖南6楼2014-12-03 18:51
            回复
              UTF-16:UNICODE的一种编码方式 当UNICODE码超过U+FFFF时 会使用特别方法编码 文中除特别注明外 讲的都是Big Endian
              当UNICODE码超过U+FFFF时 UTF-16会使用特别方法编码 这也是为什麼汉字转UNICODE和实际不同了


              IP属地:湖南7楼2014-12-03 18:56
              回复
                烂帖子都加精 什么心态


                IP属地:湖南8楼2014-12-07 12:46
                回复
                  2025-07-31 00:19:28
                  广告
                  不感兴趣
                  开通SVIP免广告
                  Ureys的“繁体字代码最新兼容版”有些人会去掉裏面的繁体字表 其实这是不对的


                  IP属地:湖南9楼2014-12-07 20:09
                  回复
                    如果自己要补充字表的话 也得按UNICODE顺序来排列 否则可能会失败
                    我也从繁体字代码一个细节猜测 百度在我们发表字符后 就开始转码了
                    那就是 http://tieba.baidu.com/f/commit/
                    这一步我猜测是强制投递至服务器 所以才没受到转码


                    IP属地:湖南11楼2014-12-07 20:27
                    回复
                      附上Ureys的“繁体字代码最新兼容版” 百度删帖了......
                      http://tieba.baidu.com/p/3199111218


                      IP属地:湖南13楼2014-12-14 16:50
                      回复
                        帖子没人看......


                        IP属地:湖南14楼2014-12-14 16:51
                        回复
                          今天 我们就来揭晓什麼直接打𦏵和𦏶没用的原因
                          答案是 百度把我们打的&变成了&!
                          真狠 原来浏览器......


                          IP属地:湖南15楼2014-12-20 14:19
                          回复
                            讲讲&是什么吧 &是&的实体名称 因此真相大白


                            IP属地:湖南16楼2014-12-20 14:24
                            收起回复
                              2025-07-31 00:13:28
                              广告
                              不感兴趣
                              开通SVIP免广告
                              涨知识了。


                              来自Android客户端17楼2014-12-21 14:33
                              回复