Стрить HTML-tags и их содержимое

Я использую DOM для parsingа строки. Мне нужна функция, которая разбивает tags span и его содержимое. Например, если у меня есть:

This is some text that contains photo.  photobyile 

Я хотел бы вернуться к функции

 This is some text that contains photo. 

Вот что я пробовал:

  $dom = new domDocument; $dom->loadHTML($string); $dom->preserveWhiteSpace = false; $spans = $dom->getElementsByTagName('span'); foreach($spans as $span) { $naslov = $span->nodeValue; echo $naslov; $string = preg_replace("/$naslov/", " ", $string); } 

Я знаю, что $span->nodeValue возвращает значение тега span, а не целого тега, но я не знаю, как получить весь тег вместе с именем classа.

Спасибо, Иль

Solutions Collecting From Web of "Стрить HTML-tags и их содержимое"

Попробуйте удалить промежутки непосредственно из дерева DOM.

 $dom = new DOMDocument(); $dom->loadHTML($string); $dom->preserveWhiteSpace = false; $elements = $dom->getElementsByTagName('span'); while($span = $elements->item(0)) { $span->parentNode->removeChild($span); } echo $dom->saveHTML(); 

@ile – У меня была эта проблема – это потому, что индекс iteratorа foreach с радостью продолжает увеличиваться, а вызов removeChild () в DOM также, кажется, удаляет узлы из DomNodeList ($ spans). Таким образом, для каждого удаляемого диапазона, нодлист сжимает один элемент, а затем получает свой счетчик foreach, увеличиваемый на единицу. Чистый результат: он пропускает один интервал.

Я уверен, что есть более элегантный способ, но так я это сделал – я переместил ссылки из DomNodeList во второй массив, где они не будут удалены с помощью операции removeChild ().

  foreach($spans as $span) { $nodes[] = $span; } foreach($nodes as $span) { $span->parentNode->removeChild($span); }