最近想用php写一个爬虫,就需要解析html,在sourceforge上找到一个项目叫做PHP Simple HTML DOM Parser,它可以以类似jQuery的方式通过css选择器来返回指定的DOM元素,功能十分强大。网站建设:http://www.ucantech.com/
首先要在程序的开始引入simple_html_dom.php这个文件
include_once('simple_html_dom.php');
PHP Simple HTML DOM Parser提供了3种方式来创建DOM对象
// Create a DOM object from a string
$html = str_get_html('<html><body>Hello!</body></html>');
// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');
// Create a DOM object from a HTML file
$html = file_get_html('test.htm');
得到DOM对象后就可以进行各种操作了
// Find all anchors, returns a array of element objects
$ret = $html->find('a');
// Find (N)th anchor, returns element object or null if not found (zero based)
$ret = $html->find('a', 0);
// Find lastest anchor, returns element object or null if not found (zero based)
$ret = $html->find('a', -1);
// Find all <div> with the id attribute
$ret = $html->find('div[id]');
// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');
这里可以使用各种css选择器,就像在jQuery中进行DOM操作一样,非常方便。此外,还有两个特殊的属性可以得到文本和注释的内容
// Find all text blocks
$es = $html->find('text');
// Find all comment (<!--...-->) blocks
$es = $html->find('comment');
当然,还是类似于jQuery,PHP Simple HTML DOM Parser也支持链式操作,以及各种访问DOM元素的简单方法
查看源码打印关于
// Example
echo $html->find("#div1", 0)->children(1)->children(1)->children(2)->id;
// or
echo $html->getElementById("div1")->childNodes(1)->childNodes(1)->childNodes(2)->getAttribute('id'); (fblww-0113)
分享到:
相关推荐
PHP解析HTML代码库:包含解析资源库。和demo。
在本篇文章里小编给大家分享了关于php用xpath解析html的代码实例讲解,对此有需要的朋友们可以学习下。
最近想用php写一个爬虫,就需要解析html,在sourceforge上找到一个项目叫做PHP Simple HTML DOM Parser,它可以以类似jQuery的方式通过css选择器来返回指定的DOM元素,功能十分强大。 首先要在程序的开始引入simple_...
如何在php中方便地解析html代码,估计是每个phper都会遇到的问题。用phpQuery就可以让php处理html代码像jQuery一样方便。 项目地址:https://code.google.com/p/phpquery/ github地址:...
123网盘在线解析源码
1.推荐使用php8以上 速度更快 2.此播放器不支持直链必须有json接口 3.支不支持解析全看你的json接口支不支持 4.如果只想播放.m3u8.mp4.ts.mpd 资源 请填入目录下json.php 例如:域名/json.php?url= config.php自行...
得到数据我们不能直接输出,往往需要对内容进行提取,然后再... 使用插件(如:http://sourceforge.net/projects/snoopy/) 二、PHP解析html或xml代码主要方式: 1. 正则表达式 2. PHP DOMDocument对象 3. 插件(如:PHP
每次要用PHP的某个功能的时候,都要去查一下,于是决定将PHP所有类和函数都整理出来,加上注释 大致实现 将php.jar文件解压,取出目录存根 将stubs中的所有php文件中的注释去掉,并做格式化处理,放在目录输出 将...
php发送邮件的核心代码,只提供重要代码,页面html代码需要自解析哦
php-latex 该库的主要目的是从用户输入中提供有效的LaTeX输出,但并不总是有效。 您也可以将LaTeX代码呈现为HTML,但是有一... 解析LaTeX源代码: $ parser = new PhpLatex_Parser (); $ parsedTree = $ this -> par
此引导有点不同的就是他不是html,因为解析的代码需要php的支持,所以就改掉了,请使用php空间哦。 此源码可以播放自己的音乐,音乐修改:使用了外链解析直接写入网易音乐的id,此源码已改成外链模式。 按钮多半都是...
先来看看演示效果: ...如果需要设置某元素的HTML代码,那么也可以使用该方法,不过需要为它传递一个参数。例如要设置p元素的HTML代码,可以使用如下代码: //设置p元素的HTML代码 $("p").html("欢迎您访
概述 爬虫是我们在做程序时经常会遇到的一种功能。... ...1.file()函数 2.file_get_contents()...6.使用开源工具,如:snoopy PHP解析XML或HTML主要方式 1.正则表达式 2.PHP DOMDocument对象 3.插件,如:PHP
由于基于php模块dom,所以在解析html时的效率比PHP Simple HTML DOM Parser快好几倍。注意:html代码必须是utf-8编码字符,如果不是请转成utf-8如果有乱码的问题参考: ://www.fwolf.com/blog/post/314现在支持...
本文实例讲述了PHP读取、解析eml文件及生成网页的方法。分享给大家供大家参考,具体如下: php读取eml实例,本实例可以将导出eml文件解析成正文,并且可以将附件保存到服务器。不多说直接贴代码了。 <?php // ...
PHP100视频教程15:PHP生成HTML文件原理 PHP100视频教程16:PHP小偷程序原理和实例 PHP100视频教程17:PHP面向对象开发的学习(一) PHP100视频教程18:PHP面向对象开发的学习(二) PHP100视频教程19:PHP面向...
1、运行环境 ...详细技术:HTML+CSS+js+PHP+MYSQL 2、该系统包含前后台 3、管理员登录后增删改查新闻信息,前台展示新闻,图片轮播 4、共2个数据表:管理员表、新闻表 计算机毕业设计完整源码,原创设计