呵呵由于正则不熟,所以另谋絀路——利用XML去解析html
要想将抓取到的数据(直接抓取到的是byte[]) 转为XML文档(即XMLDocument对象),有两个要点:
一、判断编码(http头 charset 在某些网站上是不准确的)
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。
点击添加站长微信