关于   小悟志   栏目   标签   文章   归档   友链

   云上小悟  +  

当前位置 : 首页 » InfoTech » 什么是UTF-8 without BOM? 正文

什么是UTF-8 without BOM?

InfoTech / by: 麦新杰 / 发布:2017年1月23日 / 26次阅读 / 2条评论
标签:计算机   / 最后修改时间: 2017-01-23 17:29:32

InfoTech / 2017年1月23日 / 26次阅读 / 标签:计算机  

拍拍贷
featured image

使用notepad++编写PHP和Python程序代码时,要选择UTF-8 without BOM这样的编码格式。为什么?什么是UTF-8 without BOM?

 

BOM是Byte Order Mark的缩写,就是字节序标记。

在UCS 编码(就是Unicode)中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FE FF。而FF FE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian(大字节序)的;如果收到FFFE,就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

UTF-8不存在字节序的问题,UTF-8不需要BOM来表明字节顺序。

 

编写程序代码文件,如果有BOM存在,相当于文件多出来几个字节,这样会在文件解析的时候出错。因此,我们选择UTF-8 without BOM。

为什么选择UTF-8?因为这样的选择,可以让我们的程序代码直接包含中文,并且不会出现因字节序的问题带来的编码错误。

推荐阅读:各种编码方式学习

 

-- (*^-^*) --

本文链接:http://www.maixj.net/ict/utf-8-without-bom-14015
云上小悟 麦新杰(QQ:1093023102)

《什么是UTF-8 without BOM?》有2条评论

电子邮件地址不会被公开。 必填项已用*标注

  • 麦新杰  said:

    现在notepad++默认UTF-8就是without BOM的,without BOM没有再显示出来。   [ 回复 ]

  • vultr  said:

    什么是它我不知道,我只知道手机导出的联系人要转成这个格式再导入才不会有乱码!嗯,我用的是华为   [ 回复 ]


前一篇:
后一篇:

云上小悟独立博客网站文章内容,除非特别注明,全部都是原创(非原创请阅读本站版权声明),如需转载,请保留文章链接!原创文章更具个性,有些文字虽略显随意,但不影响个人思想表达。部分文章是我自己的笔记,为自己记录,总结和收藏,同时也分享给您!这是本博建设的出发点,希望您喜欢并得到您的支持!

©Copyright 麦新杰 Since 2014 云上小悟独立博客版权所有  备案号:苏ICP备14045477号-1  economists.cn的备案号:苏ICP备14045477号-3  
    联系我们

云上小悟,麦新杰的独立博客
网站二维码
go to top