返回列表 发帖

强国社区正文抓取问题

http://bbs1.people.com.cn/post/1/1/1/161220436.html
<div class="article scrollFlag" id="post_content_161220436" allowOutsideImage="true"   content_id="161220436" content_path="http://bbs1.people.com.cn/posts/Y0/09/9C/07/54/content_html.txt"        >

正文在txt文本里面怎么通过内容脚本提取出来呢?

这个txt文件是否可以直接访问?如果可以,则链接脚本将该txt文件的路径构造为<a>标签,使雷达采集深度为2,从而采集到该文件内容。

TOP

回复 2# 齐幸媛

txt文件里面只有正文 怎么和主贴(标题、时间、URL等)相关联呢能否配置好 发出来学习下呢
多谢回复

TOP

有解决办法吗

TOP

返回列表