dedecms 的cn_substr_utf8字符串截取函數(shù)商榷

字號(hào):


    在dedecms里面 cn_substr_utf8 函數(shù)是這樣的
    代碼如下:
    /**
    * utf-8中文截取,單字節(jié)截取模式
    *
    * @access public
    * @param string $str 需要截取的字符串
    * @param int $slen 截取的長(zhǎng)度
    * @param int $startdd 開(kāi)始標(biāo)記處
    * @return string
    */
    if ( ! function_exists('cn_substr_utf8'))
    {
    function cn_substr_utf8($str, $length, $start=0)
    {
    if(strlen($str) < $start+1)
    {
    return '';
    }
    preg_match_all("/./su", $str, $ar);
    $str = '';
    $tstr = '';</p> <p> //為了兼容mysql4.1以下版本,與數(shù)據(jù)庫(kù)varchar一致,這里使用按字節(jié)截取
    for($i=0; isset($ar[0][$i]); $i++)
    {
    if(strlen($tstr) < $start)
    {
    $tstr .= $ar[0][$i];
    }
    else
    {
    if(strlen($str) < $length + strlen($ar[0][$i]) )
    {
    $str .= $ar[0][$i];
    }
    else
    {
    break;
    }
    }
    }
    return $str;
    }
    }
    其中
    代碼如下:
    if(strlen($str) < $length + strlen($ar[0][$i]) )
    一行可能會(huì)造成截取后多了一個(gè)字符,可以考慮改為
    代碼如下:
    if(strlen($str) < $length + strlen($ar[0][$i]) -1 )
    測(cè)試代碼如下
    代碼如下:
    $f = "你好fasdfa你fasdf#e#";
    $pos = strpos($f,'#e#');
    var_dump($pos);
    var_dump(cn_substr_utf8($f,$pos));
    var_dump(cn_substr_utf82($f,$pos));</p> <p>function cn_substr($str, $slen, $startdd=0)
    {
    global $cfg_soft_lang;
    if($cfg_soft_lang=='utf-8')
    {
    return cn_substr_utf8($str, $slen, $startdd);
    }
    $restr = '';
    $c = '';
    $str_len = strlen($str);
    if($str_len < $startdd+1)
    {
    return '';
    }
    if($str_len < $startdd + $slen || $slen==0)
    {
    $slen = $str_len - $startdd;
    }
    $enddd = $startdd + $slen - 1;
    for($i=0;$i<$str_len;$i++) { if($startdd==0) { $restr .= $c; } else if($i > $startdd)
    {
    $restr .= $c;
    }</p> <p> if(ord($str[$i])>0x80)
    {
    if($str_len>$i+1)
    {
    $c = $str[$i].$str[$i+1];
    }
    $i++;
    }
    else
    {
    $c = $str[$i];
    }</p> <p> if($i >= $enddd)
    {
    if(strlen($restr)+strlen($c)>$slen)
    {
    break;
    }
    else
    {
    $restr .= $c;
    break;
    }
    }
    }
    return $restr;
    }</p> <p>function cn_substr_utf8($str, $length, $start=0)
    {
    if(strlen($str) < $start+1)
    {
    return '';
    }
    preg_match_all("/./su", $str, $ar);</p> <p> $str = '';
    $tstr = '';</p> <p> //為了兼容mysql4.1以下版本,與數(shù)據(jù)庫(kù)varchar一致,這里使用按字節(jié)截取
    for($i=0; isset($ar[0][$i]); $i++)
    {
    if(strlen($tstr) < $start)
    {</p> <p> $tstr .= $ar[0][$i];
    }
    else
    {</p> <p> if(strlen($str) < $length + strlen($ar[0][$i]) )
    {</p> <p> $str .= $ar[0][$i];
    }
    else
    {</p> <p> break;
    }
    }
    }
    return $str;
    }</p> <p>function cn_substr_utf82($str, $length, $start=0)
    {
    if(strlen($str) < $start+1)
    {
    return '';
    }
    preg_match_all("/./su", $str, $ar);</p> <p> $str = '';
    $tstr = '';</p> <p> //為了兼容mysql4.1以下版本,與數(shù)據(jù)庫(kù)varchar一致,這里使用按字節(jié)截取
    for($i=0; isset($ar[0][$i]); $i++)
    {
    if(strlen($tstr) < $start)
    {</p> <p> $tstr .= $ar[0][$i];
    }
    else
    {</p> <p> if(strlen($str) < $length + strlen($ar[0][$i]) -1 ) // phpsir 加了 -1
    {</p> <p> $str .= $ar[0][$i];
    }
    else
    {</p> <p> break;
    }
    }
    }
    return $str;
    }