中文域名的骗局

昨天听同事说自己有个中文域名,说让我赶紧也抢注几个.我想想还是算了吧,单从使用角度来考虑,输入一个网址,需要切换一下输入法才行就让人很别扭.
借此事,正好一探中文域名的来龙去脉和真正的秘密.
在查询过程中搜索相关技术的时候看到一个中文域名 http://中文.tw/ 就以此为例:
用浏览器打开该网址,
谷歌浏览器在network中显示如图信息
台湾.tw
 
也就是说浏览器在打开http://中文.tw 的时候,浏览器自动识别成 http://xn--fiq228c.tw/ 这个地址了.
那么这两个地址究竟是不是一个地址呢?看数据
这个是我在新网查询
 
xn-- 前缀禁止查询

中文.com

新网禁止查询xn--开头


万网.中文

万网拒绝查询xn--开头的域名


纳网拒绝查询

纳网拒绝查询


国内几乎所有的域名代理商都拒绝查询xn--fiq228c 的信息.
然而西部数码非常意外的查询到了相应的信息,
西部数码意外能查询到信息

西部数码意外能查询到信息


虽然查不到xn--fiq228c.tw的信息,就用xn--fiq228c.top来说明一下:
中文.top
 
xn-fiq228c.top 第一行赫然写着 中文.top,拿一个普通的英文域名来对比一下 baidu.top
baidu.top
 
baidu.top正常显示baidu.top
所以到目前来看,中文域名就是国内域名代理商的一个骗局,大概也是国际上默认的一个骗局吧
一位有一种技术叫做:中文域名转码,即将中文域名转化为punycode码.
而且主流浏览器都支持punycode技术,也就是你现在能访问到中文域名的原因.
你以为自己注册的超短的中文域名,其实还是一段英文字符,而且还是毫无规律的.
到这里,问题来了,中文域名的确是可以很容易记忆的,但是搜索引擎的抓取呢?
测试发现,百度浏览器并不能抓取中文域名,而是抓取的经过punycode转码的英文域名信息.
 
站外链接: http://www.jianshu.com/p/df0aeaa07779#
 

五月 14th, 2015 by