问题:使用pyquery解析html文件时,会自动闭合空标签,如何取消
解决:增加method='html'
方法:
from pyquery import PyQuery as pq
html="<div>123<h3></h3>123</div>"
d=pq(html)
print(d("div").html())
这里会输出123<h3/>123
如果想输出123<h3></h3>123
print(d('div').html(method='html'))
参考:
https://segmentfault.com/q/1010000008102079/a-1020000008109724