本篇內容介紹了“如何用PHP實現檢查字符串中的中文字符個數”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
發展壯大離不開廣大客戶長期以來的信賴與支持,我們將始終秉承“誠信為本、服務至上”的服務理念,堅持“二合一”的優良服務模式,真誠服務每家企業,認真做好每個細節,不斷完善自我,成就企業,實現共贏。行業涉及發電機維修等,在重慶網站建設公司、成都營銷網站建設、WAP手機網站、VI設計、軟件開發等項目上具有豐富的設計經驗。有時候我們需要計算一個字符串中包含的字數,對于純英文字符串,字數等于字符串長度,用
strlen函數即可獲得,但如果字符串中包含中文怎辦?mb_strlen可以實現,但不幸沒裝擴展,那就自己實現一下吧。
php有一個擴展一般是必裝的,我們可以使用mb_strlen來獲取字符串中的字數,用法一般如下:
$len = mb_strlen("你是我的小蘋果","utf-8");
如愿獲得字符串長度:7.
如果沒裝mb擴展呢?自己實現一下吧。
我們要先明白一個事實:字符串是由字符組成的,而字符是由字節表示的,每個英文字符是一個字節,對應一個ascii碼,英文字符的ascii碼是小于128的,也就是十六進制的 0x80 .當一個字節的ascii碼超過了127,那就說明當前字節不是一個完整的字符。
比如
$str = "你是我的小蘋果";
中的$str{0}可以取到第一個字節,我們來看一下它是啥:
php > $str = "你是我的小蘋果"; php > echo $str{0}; ?
是個亂碼,它只是
復制代碼 代碼如下:
你
字的字節之一,也就是說,
復制代碼 代碼如下:
你
這個字符是由超過一個字節組成的,我們這樣試試:
php > echo $str{0}.$str{1}.$str{2};
你
可以看到,將三個字節連在一起輸出,就成了一個完整的
復制代碼 代碼如下:
你
。
至于這里為什么是三個字節,而不是兩個或4個?這個取決于字符串的編碼,我這里控制臺默認是utf8編碼的,在PHP中,一個utf8字符是用三個字節表達的,如果是gbk編碼,則會是兩個字節。至于編碼和字節的關系,這個話題比較大,一篇說不完,請參考這篇文章:字符編碼筆記:ascii,unicode和utf8 。
知道了這些,我們就可以自己編寫一個字數檢查的函數了,大致流程如下:
1.for循環遍歷字節 2.判斷字節編碼是否 >= 0x80,是的話跳過N個字節
我寫了個簡單的函數,可以判斷gbk或utf8字符串的長度,僅供參考:
<?php function mbstrlen($str,$encoding="utf8") { if (($len = strlen($str)) == 0) { return 0; } $encoding = strtolower($encoding); if ($encoding == "utf8" or $encoding == "utf-8") { $step = 3; } elseif ($encoding == "gbk" or $encoding == "gb2312") { $step = 2; } else { return false; } $count = 0; for ($i=0; $i<$len; $i++) { $count++; //如果字節碼大于127,則根據編碼跳幾個字節 if (ord($str{$i}) >= 0x80) { $i = $i + $step - 1;//之所以減去1,因為for循環本身還要$i++ } } return $count; } echo mbstrlen(iconv("utf-8","gbk","你是我的小蘋果"),"gbk"); echo mbstrlen("你是我的小蘋果");
“如何用PHP實現檢查字符串中的中文字符個數”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注創新互聯網站,小編將為大家輸出更多高質量的實用文章!
網站題目:如何用PHP實現檢查字符串中的中文字符個數-創新互聯
URL鏈接:http://newbst.com/article48/dgjoep.html
成都網站建設公司_創新互聯,為您提供網站收錄、App開發、自適應網站、網站營銷、外貿網站建設、小程序開發
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯