日期:2012-7-20 来源:GBin1.com
在线演示
本地下载
如果你曾经开发过内容聚合类网站的话,使用程序动态整合来自不同页面或者网站内容的功能肯定对于你来说非常熟悉。通常使用java
的话,我们都会使用到一些HTML的解析,例如,httpparser,最早gbin1.com
的整合搜索就是使用httpparser来抓取Google和Baidu的搜索结果,并且整合呈现给搜索用户,这也就是GBin1域名的由来。
那么今天呢,我们介绍另外一个超棒的Java的HTML解析器 - jsoup
,这个类库可以帮助大家实时的处理HTML。提供了非常方便的API来提取和处理数据,最重要的它使用类似jQuery
的语法来处理DOM
,CSS
等,如果你使用过jQuery
的话,就知道它处理DOM的强大方便之处。
主要特性
jsoup实现了WHATWG HTML5
的标准,和现代浏览器解析DOM的方式一样。主要功能:
- 可以从URL,文件或者字符串中抓取和解析HTML
- 使用DOM的查询和CSS选择器来查找和解压数据
- 可以处理HTML的属性,元素和文本
- 帮助用户处理递交的内容,并且防止XSS攻击
- 输出干净的HTML
基本上jsoup
可以帮助你处理各种的HTML问题,并且帮助你验证非法的tag,创建一个干净的DOM树。
.....
来源:使用java的html解析器jsoup和jQuery实现一个自动重复抓取任意网站页面指定元素的web应用
分享到:
相关推荐
Jsoup HTML解析器For Java 在Java程序中使用JQuery操作DOM 模式识别的新技术 狂顶
基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip 基于java的开发源码-HTML解析器 jsoup.zip ...
jsoup Java HTML解析器 jsoup Java HTML解析器 jsoup Java HTML解析器 jsoup Java HTML解析器 jsoup Java HTML解析器
Java解析html的实用工具jsoup和它一个简单的例子,方便使用jsoup进行html的解析
它使用最好的 HTML5 DOM 方法和 CSS 选择器,提供了一个非常方便的 API,用于获取 URL 以及提取和操作数据。 jsoup实现了WHATWG HTML5规范,并将 HTML 解析为与现代浏览器相同的 DOM。 从 URL、文件或字符串中抓取...
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。 jsoup的主要功能如下: 从一个URL,文件或...
基于Java的HTML解析器 jsoup.zip
基于java的HTML解析器 jsoup.zip
使用Jsoup解析html网页,包含jsoup.jar \ api.chm \ 代码
java源码:HTML解析器 jsoup.rar
java网页抓取所需的Jsoup三个包 jsoup-1.8.1.jar
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。 jsoup 可以从包括字符串、URL 地址...
基于Java的源码-HTML解析器 jsoup.zip
HTML解析器 jsoup资料
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
基于Java的实例源码-HTML解析器 jsoup.zip
主要介绍了Java爬虫Jsoup+httpclient获取动态生成的数据的相关资料,需要的朋友可以参考下
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。jsoup的主要功能如下:从一个URL,文件或字符串...
使用java+jsoup进行网页数据的抓取,提取自己想要的数据
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。