前嗅ForeSpider脚本教程:基础对象(二)

今天,小编给大家介绍一下:前嗅ForeSpider脚本中的基础对象,主要内容有:数组类array、键值对类hash、文件类file、字段操作类field。具体内容如下:

 

一.数组类array

 

array 类为数组类。

 

1.类成员

 

2.成员方法

 

3.脚本应用

如果在导航栏的采集预览中找到多个栏目,我们需要的个别栏目在爬虫的链接过滤中很难得到的时候。那就可以在网页源码中找到需要的链接和栏目标题,用如下脚本

示例:

array city;//定义一个数组

city = [{name:"北京",url:"/zhaopin/diqu/beijing/"},

{name:"天津",url:"/zhaopin/diqu/tianjin/"},

{name:"河北",url:"/zhaopin/diqu/huabei/"}];   

for(int i = 0;i < city.length; i++){

    url u;

    u.title = city[i].name; //需要输出的栏目标题

    u.urlname = "http://www.gaoxiaojob.com"+city[i].url;

    //拼接出需要的栏目链接

    u.tmplid = 2;    //指定处理模板

    u.entryid = CHANN.id;  

    RESULT.AddLink(u);   //输出

}  

脚本的输出结果

【输出结果】

 

二.键值对类hash

 

hash 类为键值对类。

 

1.类成员

2.成员方法

Iter遍历hash样例:hash hs;

hs.aa = 1;

hs.bb = 2;

hs.Iter(function(n,v){

    echo(n+":" + v +"<br>");

});

 

三.文件类file

 

file 类为文件操作类。

一.类成员:

二.成员方法:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章