PHP如何返回汉字或混合字符的长度
本篇内容介绍了“PHP如何返回汉字或混合字符的长度”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
如何计算中文字符串长度?对于这个问题,我们可能第一反应就是使用strlen()函数,但strlen()函数处理全英文字符串还是不错的,但当了中英文混合或纯中文的字符串中,就不行了。我们看看下面的例子:
<?phpheader("Content-type:text/html;charset=utf-8"); //设置字符编码为utf-8$str = "欢迎来到编程网!";echo '字符串 “'.$str.'” 的长度为:'.strlen($str).'<br>';?>
输出结果为:
可以看出,strlen()函数因为处理字符的规则不同,无法准确的返回中英文混合或纯中文字符串的长度。那么为什么会返回27呢?
那是因为我们采用的字符编码为utf-8,在UTF-8 编码下一个中文字符占三个字节。
strlen()函数在ASCII码下,一个中文汉字占两个字节的空间;在UTF-8编码下,一个中文(含繁体)等于三个字节;在Unicode编码下,一个中文(含繁体)等于两个字节。
而上例中的字符串“欢迎来到编程网!
”中一个包含了8个中文字符,3个英文字符,则8*3+3=27
个字节,则字符串长度为27。
但这样的字符串长度不是我们想要的,那样如何处理中文字符,可以准确的计算出我们想要的中英文混合或纯中文字符串的长度呢?
PHP提供了一个函数来解决这个问题,那就是mb_strlen() 函数。
还是上个示例,这次使用mb_strlen() 函数来计算字符串长度:
<?phpheader("Content-type:text/html;charset=utf-8");$str = "欢迎来到编程网!";echo '字符串 “'.$str.'” 的长度为:'.mb_strlen($str,'utf-8').'<br>';?>
输出结果为:
可以看出:字符串$str
中,中文+英文+感叹号,一个有11个字符,输出结果也为11。对了,找到对的人了~
mb_strlen() 函数中无论是汉字,还是英文、数字、小数点、下划线和空格,都只占一个字节。
下面我们来简单了解一下mb_strlen() 函数。
mb_strlen($string,$encoding)
函数可以通过设置字符编码从而返回对应的字符数;该函数接受一个必需参数$string(需要检测的字符串)和一个可省略的参数$encoding
(字符编码),如果省略则使用内部字符编码。
我们可以通过设置对应的$encoding
参数,就能很好的处理中文字符串的长度问题。
“PHP如何返回汉字或混合字符的长度”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341