本文实例讲述了php使用simple_html_dom解析HTML的方法。分享给大家供大家参考,具体如下:
今天写了两个爬虫, 一个使用Python, 一个使用PHP, 说实在, 两个实现的方式都很方便.
下面说一下使用simple_html_dom这个开源类来解析HTML代码:
1. 下载simple_html_dom:http://sourceforge.net/projects/simplehtmldom/files/
或者点击此处本站下载。
2. 用法示例:<?php// example of how to use basic selector to retrieve HTML contentsinclude("../simple_html_dom.php");// get DOM from URL or file$html = file_get_html("http://www.google.com/");// find all linkforeach($html->find("a") as $e) echo $e->href . "<br>";// find all imageforeach($html->find("img") as $e)echo $e->src . "<br>";// find all image with full tagforeach($html->find("img") as $e)echo $e->outertext . "<br>";// find all div tags with id=gbarforeach($html->find("div#gbar") as $e)echo $e->innertext . "<br>";// find all span tags with class=gb1foreach($html->find("span.gb1") as $e)echo $e->outertext . "<br>";// find all td tags with attribite align=centerforeach($html->find("td[align=center]") as $e)echo $e->innertext . "<br>";// extract text from tableecho $html->find("td[align="center"]", 1)->plaintext."<br><hr>";// extract text from HTMLecho $html->plaintext;?>
更多关于PHP相关内容感兴趣的读者可查看本站专题:《PHP编码与转码操作技巧汇总》、《php面向对象程序设计入门教程》、《PHP数学运算技巧总结》、《PHP数组(Array)操作技巧大全》、《php字符串(string)用法总结》、《PHP数据结构与算法教程》、《php程序设计算法总结》、《php正则表达式用法总结》及《php常见数据库操作技巧汇总》
希望本文所述对大家PHP程序设计有所帮助。