网页内容提取
使用不同技术提取、定位网页内容
使用正则、xpath获取网页内容
正则
以如下html代码为例:
2024必看热片
<ul>
<li>
<a href="/i/113004.html">2024年国产6.4分犯罪片《浴火之路》</a>
</li>
<li>
<a href="/i/112875.html">2024年国产犯罪片《逆鳞》</a>
</li>
</ul>
使用不同技术提取、定位网页内容
使用正则、xpath获取网页内容
以如下html代码为例:
2024必看热片
<ul>
<li>
<a href="/i/113004.html">2024年国产6.4分犯罪片《浴火之路》</a>
</li>
<li>
<a href="/i/112875.html">2024年国产犯罪片《逆鳞》</a>
</li>
</ul>