[PHP] 文字列切ってマルズルイムピョ付ける関数

function text_dot($text, $len){
	$text = strip_tags($text);
	if(strlen($text)<=$len) {
		return $text;
	} else {
		$text = htmlspecialchars_decode($text);
		$text = mb_strcut($text, 0, $len, 'utf-8');
		$text = htmlspecialchars($text);
		return $text."…";
	}
}

上関数を使えば字を切った後マルズルイムピョを付ける.

特徴1 – `htmlspecialchars_decode` 関数

一応 htmlspecialchars_decode 関数を使った.

HTMLで <私>を表現しようとすれば < おこるが > ような形態で使って与えるとする.

定木, <ハンギョレ> という文字列があると思って見よう. 前から 7バイトを切ると思おう. それでは ‘<ハンギョ’ と出るのだと思うのだ. しかしない. 関数はたぶん ‘<たいてい’ 万リターンするのだ. (UTF-8仕事時英文は 1バイト, ハングルは 3バイト処理される.)

すなわち, HTMLで使う特殊文字の文字列が切られる場合を念頭に置くとするのだ.

そのため DB あぶ保存された文字列形態である ‘<ハンギョレ>’を `htmlspecialchars_decode()` を利用して ‘<ハンギョレ>’路作った次文字列を切るのだ.

特徴2 -`mb_strcut` 関数

普通文字列を切る時 substrを使うことだ. しかしこれはアルファベットに最適化されたやつだ. これでハングルを切れば字が割れる場合が生ずる.

そのため mb_strcutおこるが mb_substrという関数が鳥で出た. (鳥で出たとしてももう PHP4.0.6 からあったのようだ;; これ二関数は違う方法でような役目を遂行する. 団, mb_substr銀因子値で 1これ字詰めで, mb_strcut銀バイト数だ.)これら関数の mb増えた multi-byte義弱者だ.

これ関数を使えばハングルも割れるのなくて寝る切られる.

例題

下と一緒に test.php なんかのファイルを作って行って見れば関数を寝る理解する数あるのだ.

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<?
$str="abcわ!!!";
echo "元々 文字列: $str <br/>";
$after_substr4=substr($str,0,4);
$after_substr5=substr($str,0,5);
$after_substr6=substr($str,0,6);
$after_substr7=substr($str,0,7);
$after_substr8=substr($str,0,8);
$after_substr9=substr($str,0,9);
echo "after substr 4: $after_substr4 <br/>";
echo "after substr 5: $after_substr5 <br/>";
echo "after substr 6: $after_substr6 <br/>";
echo "after substr 7: $after_substr7 <br/>";
echo "after substr 8: $after_substr8 <br/>";
echo "after substr 9: $after_substr9 <br/>";

$after_mb_strcut4 = mb_strcut($str,0,4, "UTF-8" );
$after_mb_strcut5 = mb_strcut($str,0,5, "UTF-8" );
$after_mb_strcut6 = mb_strcut($str,0,6, "UTF-8" );
$after_mb_strcut7 = mb_strcut($str,0,7, "UTF-8" );
$after_mb_strcut8 = mb_strcut($str,0,8, "UTF-8" );
$after_mb_strcut9 = mb_strcut($str,0,9, "UTF-8" );
echo "after mb_strcut 4: $after_mb_strcut4 <br/>";
echo "after mb_strcut 5: $after_mb_strcut5 <br/>";
echo "after mb_strcut 6: $after_mb_strcut6 <br/>";
echo "after mb_strcut 7: $after_mb_strcut7 <br/>";
echo "after mb_strcut 8: $after_mb_strcut8 <br/>";
echo "after mb_strcut 9: $after_mb_strcut9 <br/>";

/*結果 -
元々 文字列: abcわ!!!
after substr 4: abc
after substr 5: abc
after substr 6: abcわ
after substr 7: abcわ!
after substr 8: abcわ!!
after substr 9: abcわ!!!
after mb_strcut 4: abc
after mb_strcut 5: abc
after mb_strcut 6: abcわ
after mb_strcut 7: abcわ!
after mb_strcut 8: abcわ!!
after mb_strcut 9: abcわ!!!
*/
?>

substr路 4バイトや 5バイトを切った時ハングルが割れるのを卵数ある. 特殊文字と英文は 1バイト, ハングルは 3バイト処理されるというのも卵数ある.

- コメント機能はありません。コメントの代わりに[email protected]にメールを送ってください。

特徴1 – htmlspecialchars_decode 関数

特徴2 -mb_strcut 関数

例題

特徴1 – `htmlspecialchars_decode` 関数

特徴2 -`mb_strcut` 関数