`
wzjs2011
  • 浏览: 30776 次
文章分类
社区版块
存档分类
最新评论

用php解析html代码

阅读更多
最近想用php写一个爬虫,就需要解析html,在sourceforge上找到一个项目叫做PHP Simple HTML DOM Parser,它可以以类似jQuery的方式通过css选择器来返回指定的DOM元素,功能十分强大。网站建设:http://www.ucantech.com/

首先要在程序的开始引入simple_html_dom.php这个文件

include_once('simple_html_dom.php');

PHP Simple HTML DOM Parser提供了3种方式来创建DOM对象


// Create a DOM object from a string
$html = str_get_html('<html><body>Hello!</body></html>');

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');

// Create a DOM object from a HTML file
$html = file_get_html('test.htm');


得到DOM对象后就可以进行各种操作了


// Find all anchors, returns a array of element objects
$ret = $html->find('a');

// Find (N)th anchor, returns element object or null if not found (zero based)
$ret = $html->find('a', 0);

// Find lastest anchor, returns element object or null if not found (zero based)
$ret = $html->find('a', -1);

// Find all <div> with the id attribute
$ret = $html->find('div[id]');

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');


这里可以使用各种css选择器,就像在jQuery中进行DOM操作一样,非常方便。此外,还有两个特殊的属性可以得到文本和注释的内容


// Find all text blocks
$es = $html->find('text');

// Find all comment (<!--...-->) blocks
$es = $html->find('comment');


当然,还是类似于jQuery,PHP Simple HTML DOM Parser也支持链式操作,以及各种访问DOM元素的简单方法
查看源码打印关于


// Example
echo $html->find("#div1", 0)->children(1)->children(1)->children(2)->id;
// or
echo $html->getElementById("div1")->childNodes(1)->childNodes(1)->childNodes(2)->getAttribute('id'); (fblww-0113)
分享到:
评论

相关推荐

    PHP解析HTML代码库

    PHP解析HTML代码库:包含解析资源库。和demo。

    php用xpath解析html的代码实例讲解

    在本篇文章里小编给大家分享了关于php用xpath解析html的代码实例讲解,对此有需要的朋友们可以学习下。

    用php解析html的实现代码

    最近想用php写一个爬虫,就需要解析html,在sourceforge上找到一个项目叫做PHP Simple HTML DOM Parser,它可以以类似jQuery的方式通过css选择器来返回指定的DOM元素,功能十分强大。 首先要在程序的开始引入simple_...

    phpQuery让php处理html代码像jQuery一样方便

    如何在php中方便地解析html代码,估计是每个phper都会遇到的问题。用phpQuery就可以让php处理html代码像jQuery一样方便。 项目地址:https://code.google.com/p/phpquery/ github地址:...

    123网盘在线解析源码.rar

    123网盘在线解析源码

    Artplayer 视频播放器全开源PHP源码 带弹幕库源码(播放器源代码)

    1.推荐使用php8以上 速度更快 2.此播放器不支持直链必须有json接口 3.支不支持解析全看你的json接口支不支持 4.如果只想播放.m3u8.mp4.ts.mpd 资源 请填入目录下json.php 例如:域名/json.php?url= config.php自行...

    php抓取页面与代码解析 推荐

    得到数据我们不能直接输出,往往需要对内容进行提取,然后再... 使用插件(如:http://sourceforge.net/projects/snoopy/) 二、PHP解析html或xml代码主要方式: 1. 正则表达式 2. PHP DOMDocument对象 3. 插件(如:PHP

    phpNote:golang解析php

    每次要用PHP的某个功能的时候,都要去查一下,于是决定将PHP所有类和函数都整理出来,加上注释 大致实现 将php.jar文件解压,取出目录存根 将stubs中的所有php文件中的注释去掉,并做格式化处理,放在目录输出 将...

    php发送邮件核心代码

    php发送邮件的核心代码,只提供重要代码,页面html代码需要自解析哦

    php-latex:用PHP编写的LaTeX解析器和渲染器

    php-latex 该库的主要目的是从用户输入中提供有效的LaTeX输出,但并不总是有效。 您也可以将LaTeX代码呈现为HTML,但是有一... 解析LaTeX源代码: $ parser = new PhpLatex_Parser (); $ parsedTree = $ this -&gt; par

    Force Yc十三网站引导页php源码(自适应版本)

    此引导有点不同的就是他不是html,因为解析的代码需要php的支持,所以就改掉了,请使用php空间哦。 此源码可以播放自己的音乐,音乐修改:使用了外链解析直接写入网易音乐的id,此源码已改成外链模式。 按钮多半都是...

    JQuery获取与设置HTML元素的内容或文本的实现代码

    先来看看演示效果: ...如果需要设置某元素的HTML代码,那么也可以使用该方法,不过需要为它传递一个参数。例如要设置p元素的HTML代码,可以使用如下代码: //设置p元素的HTML代码 $("p").html("欢迎您访

    PHP抓取网页、解析HTML常用的方法总结

    概述 爬虫是我们在做程序时经常会遇到的一种功能。... ...1.file&#40;&#41;函数 2.file_get_contents&#40;&#41;...6.使用开源工具,如:snoopy PHP解析XML或HTML主要方式 1.正则表达式 2.PHP DOMDocument对象 3.插件,如:PHP

    html-parser:php html解析器,类似与PHP Simple HTML DOM Parser,但是比它快好几倍

    由于基于php模块dom,所以在解析html时的效率比PHP Simple HTML DOM Parser快好几倍。注意:html代码必须是utf-8编码字符,如果不是请转成utf-8如果有乱码的问题参考: ://www.fwolf.com/blog/post/314现在支持...

    PHP读取、解析eml文件及生成网页的方法示例

    本文实例讲述了PHP读取、解析eml文件及生成网页的方法。分享给大家供大家参考,具体如下: php读取eml实例,本实例可以将导出eml文件解析成正文,并且可以将附件保存到服务器。不多说直接贴代码了。 &lt;?php // ...

    PHP100视频教程全集112集BT种子【PHP经典】

    PHP100视频教程15:PHP生成HTML文件原理 PHP100视频教程16:PHP小偷程序原理和实例 PHP100视频教程17:PHP面向对象开发的学习(一) PHP100视频教程18:PHP面向对象开发的学习(二) PHP100视频教程19:PHP面向...

    php环境保护网 计算机毕业设计完整源码

    1、运行环境 ...详细技术:HTML+CSS+js+PHP+MYSQL 2、该系统包含前后台 3、管理员登录后增删改查新闻信息,前台展示新闻,图片轮播 4、共2个数据表:管理员表、新闻表 计算机毕业设计完整源码,原创设计

Global site tag (gtag.js) - Google Analytics