`
sanqian
  • 浏览: 29939 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

Php UTF文件编码识别

阅读更多
用于判断文件是否使用UTF编码

<?php
// Unicode BOM is U+FEFF, but after encoded, it will look like this.
define ('UTF32_BIG_ENDIAN_BOM'   , chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF));
define ('UTF32_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00));
define ('UTF16_BIG_ENDIAN_BOM'   , chr(0xFE) . chr(0xFF));
define ('UTF16_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE));
define ('UTF8_BOM'               , chr(0xEF) . chr(0xBB) . chr(0xBF));

/**
*@return 返回UTF编码格式
*
*/
function detect_utf_encoding($filename) {
   
    $text = file_get_contents($filename);
    $first2 = substr($text, 0, 2);
    $first3 = substr($text, 0, 3);
    $first4 = substr($text, 0, 3);

    if ($first3 == UTF8_BOM) return 'UTF-8';
    elseif ($first4 == UTF32_BIG_ENDIAN_BOM) return 'UTF-32BE';
    elseif ($first4 == UTF32_LITTLE_ENDIAN_BOM) return 'UTF-32LE';
    elseif ($first2 == UTF16_BIG_ENDIAN_BOM) return 'UTF-16BE';
    elseif ($first2 == UTF16_LITTLE_ENDIAN_BOM) return 'UTF-16LE';
}


?>
0
0
分享到:
评论

相关推荐

    说塔文件编码转换器 v1.0.0 bulid 080921 Beta

    说塔文件编码转换器可以将文件(如:aspx文件|*.aspx|cs文件|*.cs|asp文件|*.asp|txt文件|*.txt|css文件|*.css|js文件|*.js|jsp文件|*.jsp|php文件|*.php等)的编码格式在UTF-7、UTF-8、Unicode、ASII、Big5、GB2312...

    php自动识别文件编码并转换为UTF-8的方法

    PHP转换文件编码是一个比较简单的事情,但是在开发中传递中文参数的时候,有时候不知道是什么编码,结果造成了乱码的现象。这里有个非常方便的解决办法,可以自动识别编码并转换为UTF-8。具体代码如下: 复制代码 ...

    拼音转换类(将任意中文转换为拼音,个人改造,支持utf8,gbk编码,程序自动识别)

    拼音转换类(将任意中文转换为拼音,个人改造,支持utf8,gbk编码,程序自动识别

    八年PHP文件管理器 v2.6.2 免费版.rar

    直接显示 mp3 歌曲名称 调整了图片 增加了文件编码识别 支持直接编辑 UTF8 文件 支持新建UTF8 文件 直接显示 图片大小 细节调整 BUG 修复了一些 //2.5更新----- 修正了文件 大小计算 调整了 探针 增加了 电子邮件...

    更新的自动识别网站编码并修改的php脚本

    php脚本自动批量更改网页编码,识别页面编码并转为utf-8。

    黑链自动检查修复程序,支持多种编码

    这个是一个朋友要的,他有个几个挂黑链的网站,经常掉,这个程序可以自动检查,如果发现黑链掉了,可以自动修复。...目标网站编码自动识别,支持ASCII,GB2312,GBK,UTF8编码替换 程序功能较简陋,以后有需要再更新

    支持生僻字且自动识别utf-8编码的php汉字转拼音类

    主要介绍了支持生僻字且自动识别utf-8编码的php汉字转拼音类,非常实用!需要的朋友可以参考下

    SciTE For PHP(含最新PHP手册)

    自动识别UTF8编码,打开页面不再出现乱码了; 右键增加简单的跳转到当前页class、function、const、variables定义的菜单项; 添加对SVN的支持,不过要求安装TortoiseSVN; 类似Zend Studio的自动PHP Document注释功能...

    PHP实现UTF-8文件BOM自动检测与移除实例

    BOM信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是个UTF-8编码的文件。但PHP在读取文件时会把这些字符读出,从而形成了文件 开头含有一些无法识别的字符的问题。 比如用UTF-8格式保存的生成图片的PHP...

    SciTE For PHP(V2.01)

    自动识别UTF8编码,打开页面不再出现乱码了; 右键增加简单的跳转到当前页class、function、const、variables定义的菜单项; 添加对SVN的支持,不过要求安装TortoiseSVN; 类似Zend Studio的自动PHP Document注释功能...

    风吟PHP BOM移除工具.rar

    它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于PHP文件来说,BOM的签名是个大麻烦。受COOKIE送出机制的限制,在这些文件开头已经有BOM的...

    deletebom.php

    它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于 PHP来说,BOM是个大麻烦。  PHP并不会忽略BOM,所以在读取、包含或者引用这些文件时,...

    php中文乱码怎么办如何让浏览器自动识别utf-8

    刚开始学习php的朋友可能经常遇到问题,就是调试的时候经常显示乱码 每次打开浏览器都要改下编码,很麻烦, 有没有方法让浏览器自动识别utf-8呢? 解决的方法很简单 就是在php里加一句header 例: header(“Content-...

    PHP实现自动识别原编码并对字符串进行编码转换的方法

    本文实例讲述了PHP实现自动识别原编码并对字符串进行编码转换的方法。分享给大家供大家参考,具体如下: /** * 对数据进行编码转换 * @param array/string $data 数组 * @param string $output 转换后的编码 * ...

    php版mysql大数据库备份和恢复工具

    4.虽然程序目前支持GBK、BIG5、UTF8之间的编码转换,但这种转换不是安全的.首先你的目标导入服务器要支持iconv,即在导入时如果"编码转换功能"提示为支持,则可以使用此功能.反之则不可以.其次,转换时的数据必须是"干净...

    H_conly站长管理助手 v1.3 UTF8.rar

    2、可编辑所有文本文件,如asp、php、txt、css等,不一一列举了,并且可以自动识别文件编码格式,修改保存时也可以自定义文件编码; 3、新建文件(可自定义编码)、新建文件夹; 4、在线文本字符批量查找替换,可自动...

    PHP 下载文件时如何自动添加bom头及解释BOM头和去掉bom头的方法

    在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,比如PHP就不能识别bom头,这也是用记事本编辑utf-8编码后执行就会出错的原因...

    PHP中文分词代码 v1.0 UTF-8.rar

    PHP中文分词代码使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。由于PhpanAlysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量分词中,由于边分词边完成...

Global site tag (gtag.js) - Google Analytics