在我们做网站用火车头进行内容采集过程中,难免会遇到有的下载站把下载地址进行了隐藏,并且下载地址不统一,如下:
可以到下载地址有的是相对地址
<ul class="ul_Address"><script>_downInfo ={Address:"/anzhuo1/homie_v1.0.4_2265.com.apk",TypeID:"1",SoftLinkID:"137056",SoftID:"118759",Special:"0"}</script>
有的是绝对地址:
<script>_downInfo ={Address:"https://ugame.9game.cn/game/downloadGame?pack.cooperateModelId=51319&pack.id=21974768",TypeID:"0",SoftLinkID:"417736",SoftID:"267030",Special:"0"}</script>
我们在用火车头进行采集过程中,对这样的就需要进行一个组合判断。
首先新建标签 下载地址1,如图:
然后新建标签下载地址2:获取
数据处理里新建同义词替换:
然后新建标签下载地址,组合下载地址2+下载地址1即可。
参考规则附上:生活休闲
目标站地址:
http://www.2265.com/game/267030.html
下载地址typeID路径:
../inc/SoftLinkType.js
#免责声明#
ZHANN.CN帝国之家工作室内所有作品,均为ZHANN手写代码。部分样式或模板代码移植或仿造自互联网(如有侵权,出示著作权证书联系我删除),所有代码不能用于非法站点(色情,暴力,政治类站点)。ZHANN只提供源代码服务,不提供任何建站服务。不承担任何建站后的法律问题!ZHANN所得费用均为制作模板劳动报酬。使用开源免费的帝国CMS作为核心,请保留帝国CMS的版权。如商用请购买帝国商业版,ZHANN只做帝国CMS模板服务,不做任何建站、不制作采集任何网站内容、不出售任何非开源有版权源代码更不卖任何域名和空间服务器,我出卖的只是我的技术劳动力!如在本站发生交易任何资源或者下载任何资源,则代表默认同意以上文字内容。感谢小伙本的支持,做一个知法守法的好公民!
转载请注明: » 火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程