1.HtmlCleaner的文档对象模型拥有了一些函数,处理节点和属性,所以在序列化之前搜索或者编辑是非常容易的。熊猫高考ios版下载-熊猫高考苹果版2.1 IPhone版
2.提供基本HtmlCleanerDOM的XPath支持
3.使用XML配置文件让创建定制tag变得更加容易
4.修复多个bug以及API改进
写一个测试用的html文件:html-clean-demo.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd " >
< html xmlns = "http://www.w3.org/1999/xhtml " xml:lang = "zh-CN" dir = "ltr" >
< head >
< meta http-equiv = "Content-Type" content = "text/html; charset=GBK" />
< meta http-equiv = "Content-Language" content = "zh-CN" />
< title > html clean demo </ title >
</ head >
< body >
< div class = "d_1" >
< ul >
< li > bar </ li >
< li > foo </ li >
< li > gzz </ li >
</ ul >
</ div >
< div >
< ul >
< li > < a name = "my_href" href = "1.html" > text-1 </ a > </ li >
< li > < a name = "my_href" href = "2.html" > text-2 </ a > </ li >
< li > < a name = "my_href" href = "3.html" > text-3 </ a > </ li >
< li > < a name = "my_href" href = "4.html" > text-4 </ a > </ li >
</ ul >
</ div >
</ body >
</ html >
Html代码
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-CN" dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=GBK"/>
<meta http-equiv="Content-Language" content="zh-CN"/>
<title>html clean demo</title>
</head>
<body>
<div class="d_1">
<ul>
<li>bar</li>
<li>foo</li>
<li>gzz</li>
</ul>
</div>
<div>
<ul>
<li><a name="my_href" href="1.html">text-1</a></li>
<li><a name="my_href" href="2.html">text-2</a></li>
<li><a name="my_href" href="3.html">text-3</a></li>
<li><a name="my_href" href="4.html">text-4</a></li>
</ul>
</div>
</body>
</html>
模拟需求:取出title,name="my_href"的链接,div的class="d_1"下的所有li内容。下面用htmlcleaner写代码,HtmlCleanerDemo.java
package com.chenlb;
import java.io.File;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
/**
* htmlcleaner 使用示例.
*
* @author chenlb 2008-11-26 下午02:12:02
*/
public class HtmlCleanerDemo {
public static void main(String[] args) throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
TagNode node = cleaner.clean(new File( "html/html-clean-demo.html" ), "GBK" );
//按tag取.
Object[] ns = node.getElementsByName("title" , true ); //标题
if (ns.length > 0 ) {
System.out.println("title=" +((TagNode)ns[ 0 ]).getText());
}
System.out.println("ul/li:" );
//按xpath取
ns = node.evaluateXPath("//div[@class='d_1']//li" );
for (Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" text=" +n.getText());
}
System.out.println("a:" );
//按属性值取
ns = node.getElementsByAttValue("name" , "my_href" , true , true );
for (Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" href=" +n.getAttributeByName( "href" )+ ", text=" +n.getText());
}
}
}
Java代码
package com.chenlb;
import java.io.File;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
/**
* htmlcleaner 使用示例.
*
* @author chenlb 2008-11-26 下午02:12:02
*/
public class HtmlCleanerDemo {
public static void main(String[] args) throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
TagNode node = cleaner.clean(new File("html/html-clean-demo.html"), "GBK");
//按tag取.
Object[] ns = node.getElementsByName("title", true); //标题
if(ns.length > 0) {
System.out.println("title="+((TagNode)ns[0]).getText());
}
System.out.println("ul/li:");
//按xpath取
ns = node.evaluateXPath("//div[@class='d_1']//li");
for(Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" text="+n.getText());
}
System.out.println("a:");
//按属性值取
ns = node.getElementsByAttValue("name", "my_href", true, true);
for(Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" href="+n.getAttributeByName("href")+", text="+n.getText());
}
}
}
cleaner.clean()中的参数,可以是文件,可以是url,可以是字符串内容。个人认为:比较常用的应该是evaluateXPath、getElementsByAttValue、getElementsByName方法了。另外说明下,htmlcleaner对不规范的html兼容性比较好。
HtmlCleaner是一个免费开源的适用范围广的Java语言Html文档解析器,它能重新整理HTML文档的每个元素并生成结构良好(Well-Formed)的HTML文档。默认它遵循的规则是类似于大部份web浏览器为创文档对象模型所使用的规则,户可以提供自定义tag和规则组来进行过滤和匹配。
它被设计的小,快速,灵活而且独立。HtmlCleaner也可用在Java代码中,当命令行工具或Ant任务。解析后编程轻量级文档对象,能够很容易的被转换到DOM或者JDom标准文档,或者通过各种方式(压缩,打印)连续输出XML。
展开内容
工程制图软件-原理图绘制软件1.0 绿色中文版
藏头诗制作下载-藏头诗助手1.0 安卓版
荣耀迅雷云播白金会员账号共享器2.0 绿色免费版
洛基英语app苹果版3.2.0 ios最新按
乐居租房手机版下载-乐居租房4.3.4 官方安卓版
圣光之刃QQ登陆版-圣光之刃online礼包版1.0最新版
HP Smart app官方下载-HP Smart(惠普打印遥控手机版)16.0.3.4239 安卓版
Ace Stream Media本地播放器下载-Ace Stream Media播放器3.1.71.0 安卓版
卡巴斯基病毒专杀工具-RakhniDecryptor(卡巴斯基解密工具)1.15.10.0 绿色最新版
悠久家长版(Yojo家长版)1.2.0 安卓版
超级网络邻居(IPBook) V0.49 下载v0.49
太仓智慧停车软件1.0.5 安卓版
我的方块勘测世界手游10001 安卓版
点乐送app1.0.9 安卓手机版
帝邦租车app下载-南充帝邦租车0.0.17 安卓手机版
保密观考试题答案2021-保密观知识竞赛答案2021doc资料
冰雪重置版下载-冰雪重置版传奇1.0.1.1300 复古版
好运计步王app下载-好运计步王app1.0.0 安卓版
忍者学园怪物版下载-忍者学园怪物版1.1 安卓最新版
精准普法平台app-精准普法app1.2.1p 在线专业版
请问你为啥这么厉害解锁版下载-请问你为啥这么厉害关卡解锁版1.0.1安卓修改版
一起找茬赚红包下载-一起找茬赚红包游戏1.7.0 安卓赚钱版
毒利app免费版下载-毒利线上商城0.0.5 手机最新版
苏泊尔app下载-苏泊尔app智能连接2.6.0 官方版
skyline模拟器官方下载-skyline模拟器安卓0.0.3 中文版
9.7/1,445.1M
一款聊天记录收藏查看软件,与优读同属于同一个开发者作品。在微信中绑定知拾收藏小助手,任何发给小助手的文本、图片、语音、视频、文件、网页、地理位置都能收藏到知拾收...
手机屏幕蝴蝶下载-Butterfly on Screen Funny Joke(手机蝴蝶恶作剧软件)1.0 安卓手机版
7.7/1,084.3M
手机蝴蝶恶作剧软件是一款手机恶搞软件,该软件不仅可以美化手机桌面还可以对身边的朋友产生恶搞效果。安装好软件之后,用户可以设置立即显示,推到手机桌面会显示蝴蝶在手...
3145快递查询软件下载-3145快递查询2.0 官方版【国际物流查询】
7.7/1,671.0M
3145快递查询软件是全网最新、最全、支持快递公司最多的快递单号查询软件。不光支持国内物流查询,还支持国际物流查询,没有你查不到,只有你用不到!欢迎下载使用!3...
8.3/1,338.9M
深圳月嫂app是一款专业的月嫂服务软件,这款软件为用户提供了专业的月嫂服务,无中介环节,交易双方透明,安全有保障,我们的月嫂经过专业技能培训安全放心,快来下载吧...
韩语单词随身听APP下载-韩语单词随身听1.0.0 安卓最新版
9.5/1,452.4M
韩语单词随身听APP是一款比较不错的韩语学习软件,有了它,能带给用户比较不错的学习体验,它能帮助用户从零基础的单词词根学起,而且让你随时随地都能打开学习上两句,...
M.T管理器下载安装-MT下载器(M.T管理器修改版)1.0.3最新版
7.9/1,011.8M
M.T管理器破解版是一款功能非常强大的BT下载工具,帮你在线解析。可以帮助用户搜索全网的资源下载,搜索下载无限制,遍历种子等功能,解析各种磁力资源,有需要的朋友...
8.0/1,774.4M
霸王龙争霸是一款吞噬进化手游,在游戏中玩家开局只是一只小恐龙,在侏罗纪时代里不断狩猎,吞噬恐龙进行进化,称霸整片土地,成为侏罗纪霸主,感兴趣的小伙伴快来uzzf...
流星群侠传古刹清风下载-流星群侠传古刹清风版1.0.471710 最新版
10.0/1,428.2M
流星群侠传古刹清风版是一款动作类Arpg游戏,玩家们将会以四种不同的武器流派来开始自己的武侠之旅。游戏中将会迎来更多的关卡副本的挑战,让你在游戏中来面对更多不同...
数据恢复软件下载-数据修复软件(PC Inspector File Recovery)v4.0 多语中文绿色版
8.5/1,218.8M
可以恢复磁盘、软盘、可移动磁盘等存储设备上的数据。PC Inspector File Recovery是一个数据修复软件,它支持&...
8.9/1,567.0M
领邦临工app是一款只针对临时工,没有中介费的APP平台。主要为个人找工作及企业招工提供一个便利的平台。让更多的人注册和关注,提高就业效率和公司商业目标。领邦临...
7.5/571.3M
上古裁决3D是一款非常好玩的角色扮演手游,东坡为大家带来了这款游戏的正版下载,喜欢的同学快来下载吧!经典传奇游戏软件介绍《上古传奇》是以中国上古神话为背景,以炎...
zend studio13.6破解文件-Zend Studio 13.6.0破解补丁+注册码最新版
9.8/312.9M
ZendStudio是一款非常专业的编程调试工具,现在为大家带来zendstudio13.6版本的破解补丁,注册码也会带给大家,如果你需要这个软件的话就可以使用...
7.5/208.8M
随着淘宝网购越来越火爆,现在很多人都在淘宝开网店,但是新开的店面没有人气,就需要一些工具来刷了!今天小编给大家带来的是一款专门针对淘宝店铺刷淘宝收藏的软件,有需...
n1红蓝宝题库考日语APP-n1红蓝宝题库APP2.83.11安卓专业版
7.8/809.5M
n1红蓝宝题库是一款帮助日语考级的软件,现在日语的运用也是蛮多的,高考也可以选择日语作为高考外语,想考级的用户们快来下载学习,不仅有课程还有题库在这等着你哦,只...
街球联盟ios版官网下载-街球联盟苹果版1.0.0 官方最新版
9.1/801.1M
爱玩篮球的你,还记得一些出名的篮球手游吗?还想打造属于你自己的篮球梦想吗?想试试最新特效的篮球游戏的话,现在就可以试试下面的这款街球联盟苹果版!街球联盟苹果版超...
鲨鱼游戏交易平台下载-鲨鱼游戏交易app官方版2.1 安卓版
8.6/657.1M
鲨鱼游戏交易平台提供游戏账号出租、账号回收、账号交易服务,平台会对账号进行专业的鉴定,安全验号,非常可靠,放心交易,能够随时和卖家进行互动,超多不同类型的游戏账...
多人赛车漂移竞赛正版手游-多人赛车漂移竞赛0.1 手机免费版
8.1/28.4M
多人赛车漂移竞赛手游是一款非常刺激好玩的赛车竞速手游,支持多人联机竞速,动感的音乐、逼真的驾驶体验感,给用户带来最棒的游戏体验,心动不如行动,喜欢就快来下载体验...
CSDN免积分下载器-蛋蛋CSDN免积分下载器2.0 绿色免费版
9.8/1,908.4M
蛋蛋CSDN下载地址自动转换工具是一款CSDN免积分下载工具。很多人都喜欢在CSDN上下载各种软件,但是因为CSDN下载东西需要花费积分,对于没有积分的朋友来说...
8.9/1,571.2M
人人清理是一个手机垃圾清理软件,用户可以通过软件快速清理手机垃圾文件,帮助用户更好的管理自己的手机,还支持病毒查杀等功能!软件介绍「人人清理」是一款免费专业的手...
9.0/263.8M
摆地摊模拟器是一款休闲模拟手游,在游戏之中玩家可以选择各种摊位进行摆摊,学习各种摊位的摆摊技巧,玩起来趣味性十足,发展属于你的摆摊帝国,感兴趣的小伙伴快来uzz...
8.1/331.7M
青柚大姨妈安全期,是一款能预测经期、提前告诉经期日期、智能推算排卵期、安全期的月经期记录健康软件。为您解决大姨妈日期记不清的困扰,让您轻松跟踪经期、生理期和排卵...
9.9/36.7M
阴阳师百闻牌是阴阳师系列的游戏,可以更好地进行阴阳师的游戏,画风非常的高清,可以享受好玩的阴阳师的游戏。阴阳师百闻牌游戏特色【唯美和风,极致视听盛宴】在阴阳师百...
7.5/308.4M
酷软壁纸是一款免费提供高清酷炫壁纸的应用,每天都会直接更新,通过动态和静态壁纸的设置,让用户的手机桌面时刻保持新鲜和个性化。酷软壁纸包含多种类型的壁纸,例如风景...
Tap Skaters游戏下载-Tap Skaters(踢踏溜冰运动员)1.0.1 最新版
9.9/1,442.2M
创意点击玩法的休闲游戏!TapSkaters游戏,玩家需要控制一个萌动的角色使用滑板在场景地图中不断的滑行前进,使用不同的滑行技巧实现顺利滑行。游戏特色1、疯狂...
魔法之光之武林豪侠传官方版手游-魔法之光之武林豪侠传1.0安卓版
9.1/1,148.0M
魔法之光之武林豪侠传手游是一款东方武侠题材的角色扮演冒险战斗手游。游戏中玩家将能够展现出不一样的战斗风采,玩家可以选择游戏中的任意职业,每个职业都有着属于自己的...