htmlから文字列を抜き出す[php]

2012-11-30

htmlソース(コード)からhtmlタグを除いた文字列だけを抜き出すサンプルです。

strip_tags 関数を活用します、< から > までをnullとして文字列だけを抜き出します。

引数で除外しないタグを指定することも可能です。


$htmltags = <<<END_OF_HTML
<h2>タイトル</h2>
<p>ここは段組みのテキストです。</p>
END_OF_HTML;

header("Content-Type: text/plain; charset=UTF-8");

echo "元のHTML文字列\n";
 echo $htmltags;
 echo "\n\n";

echo "タグを全て取り除いた文字列\n";
 echo strip_tags($htmltags);
 echo "\n\n";

echo "pタグ以外のタグを取り除いた文字列\n";
 echo strip_tags($htmltags, "<p>");

Copyright(c) 2012 AbilitySystem All Rights Reserved.