Perl Search::Elasticsearch模塊使用經驗總結

原創

2019-02-22 23:53

在搭建Elasticsearch數據庫的過程中，首先使用了其推薦的Logstash工具導入數據，但是用起來非常不順手，所以想用Perl擅長的正則表達式對數據進行過濾分類，然後導入Elasticsearch，於是搜索CPAN找到了Search::Elasticsearch模塊。

該模塊在CPAN上的文檔寫的比較簡潔，於是將使用過程中的經驗總結如下：

一、逐條數據寫入：

use Search::Elasticsearch;
my $e=Search::Elasticsearch->new(nodes=>['localhost:9200']);
$e->index(
    index=>"$index_name",
    type=>"$type_name",
    id=>"$id_name",
    body=>{
        title=>"$data_name",
        data=>"$data"
    }
);

二、批量數據寫入：

use Search::Elasticsearch;
my $e=Search::Elasticsearch->new(nodes=>['localhost:9200']);
my $bulk=$e->bulk_helper(
    index=>"$index_name",
    type=>"$type_name"
);
my $i=0;
while(...){
    #do something
    $bulk->add_action(index=>{id=>$id_name,source=>{title =>$data_name,data=>$data}});
    if ($i>999){
        $bulk->flush;
        $i=0;
    }
    $i++;
}

三、讀取一條記錄：

use Search::Elasticsearch;
my $e=Search::Elasticsearch->new(nodes=>['localhost:9200']);
my $doc=$e->get(
    index=>"$index_name",
    type=>"$type_name",
    id=>"$id_name"
);
my $data=$doc->{_source}->{$data_name};
#do something

四、依次讀取全部記錄：

use Search::Elasticsearch;
my $e=Search::Elasticsearch->new(nodes=>['localhost:9200']);
my $scroll=$e->scroll_helper(
    index=>"$index_name",
    type=>"$type_name",
    body=>{
        query=>{match_all=>{}},
        size=>5000
    }
);
while (my $doc=$scroll->next){
    my $id=$doc->{_id};
    my $data=$doc->{_source}->{$data_name};
    #do something
}

五、跳轉到第$n條數據開始讀取

my $doc=$scroll->next($n);

六、基本數據查詢

use strict;
use Search::Elasticsearch;

my $e = Search::Elasticsearch->new(nodes => ['localhost:9200']);
my $results = $e->search(
    index => $index_name,
    body => {
        query => {
            query_string => { query => $search }
        }
    }
);
print $results->{hits}->{hits}->[0]->{_source}->{word};

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Perl Search::Elasticsearch模塊使用經驗總結

HTML頁面關於高分屏的設置

北歐瑞典挪威芬蘭瑞士TikTok海外網紅與YouTube博主的合作模式

歐洲英國德國法國TikTok與YouTube海外網紅達人的完美合作策略

druid數據源 xml配置

winrar目錄穿越漏洞（更新經驗）

Perl Search::Elasticsearch模塊使用經驗總結

Perl 打印引用的哈希列表

Perl 讀取特定格式的文件名

通過IP歸屬地過濾Linux服務器端口流量

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結