四種常見(jiàn)文本文件編碼方式ANSI編碼:無(wú)文件頭(文件編碼開(kāi)頭標(biāo)志性)
2021-08-31
php字符編碼轉(zhuǎn)換類(lèi),支持ANSI、big、UTF-8、UTF-8+Bom相互轉(zhuǎn)換。
四種常見(jiàn)的文本文件編碼方式
ANSI 編碼:
無(wú)文件頭(文件編碼開(kāi)頭的有效字節(jié))
ANSI編碼的字母數(shù)字占一個(gè)字節(jié),漢字占兩個(gè)字節(jié)
回車(chē)換行,單字節(jié),十六進(jìn)制表示為0d 0a
編碼:
文件頭,十六進(jìn)制表示為FF FE
每個(gè)字符用兩個(gè)字節(jié)編碼
回車(chē),換行,雙字節(jié),十六進(jìn)制表示為000d 000a
大編碼:
文件頭的十六進(jìn)制表示為FE FF
后面的編碼就是把字符的高位放在前面,低位放在后面,正好是編碼的逆過(guò)程
回車(chē),換行php轉(zhuǎn)unicode編碼,雙字節(jié)php轉(zhuǎn)unicode編碼,十六進(jìn)制表示為 0d00 0a00
UTF-8 編碼:
文件頭,十六進(jìn)制表示為EF BB BF
UTF-8 是一種可變長(zhǎng)度的字符編碼。數(shù)字、字母、回車(chē)、換行都用1個(gè)字節(jié)表示,漢字占3個(gè)字節(jié)。
回車(chē)換行,單字節(jié),十六進(jìn)制表示為0d 0a
轉(zhuǎn)換原則:先將字符編碼轉(zhuǎn)換為UTF-8,再由UTF-8轉(zhuǎn)換為對(duì)應(yīng)的字符編碼。
..php
_allow_charset)){ $this->_in_charset = $in_charset; } // 檢查輸出編碼 if(in_array($out_charset, $this->_allow_charset)){ $this->_out_charset = $out_charset; } } /** 轉(zhuǎn)換 * @param String $str 要轉(zhuǎn)換的字符串 * @return String 轉(zhuǎn)換后的字符串 */ public function convert($str){ $str = $this->convToUtf8($str); // 先轉(zhuǎn)為utf8 $str = $this->convFromUtf8($str); // 從utf8轉(zhuǎn)為對(duì)應(yīng)的編碼 return $str; } /** 把編碼轉(zhuǎn)為UTF-8編碼 * @param String $str * @return String */ private function convToUtf8($str){ if($this->_in_charset=='utf-8'){ // 編碼已經(jīng)是utf-8,不用轉(zhuǎn) return $str; } switch($this->_in_charset){ case 'utf-8bom': $str = substr($str, 3); break; case 'ansi': $str = iconv('GBK', 'UTF-8//IGNORE', $str); break; case 'unicode': $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2)); break; case 'unicodebe': $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2)); break; default: break; } return $str; } /** 把UTF-8編碼轉(zhuǎn)換為輸出編碼 * @param String $str * @return String */ private function convFromUtf8($str){ if($this->_out_charset=='utf-8'){ // 輸出編碼已經(jīng)是utf-8,不用轉(zhuǎn) return $str; } switch($this->_out_charset){ case 'utf-8bom': $str = "\xef\xbb\xbf".$str; break; case 'ansi': $str = iconv('UTF-8', 'GBK//IGNORE', $str); break; case 'unicode': $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str); break; case 'unicodebe': $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str); break; default: break; } return $str; } } // class end ?>
演示:將 big 轉(zhuǎn)換為 utf-8+bom
convert($str); file_put_contents('response/utf-8bom.txt', $response, true); ?>
源碼下載地址:點(diǎn)擊查看
以上介紹了PHP字符編碼轉(zhuǎn)換類(lèi),支持ANSI、big、UTF-8、UTF-8+Bom之間的轉(zhuǎn)換,包括內(nèi)容,希望對(duì)PHP教程感興趣的朋友有所幫助.
免責(zé)聲明:本文首發(fā)于php中文網(wǎng)。轉(zhuǎn)載請(qǐng)注明出處。感謝您的尊重!如果您有任何問(wèn)題,請(qǐng)聯(lián)系我們