原创 使用Python結合Elasticsearch對CSV文件內容進行分詞

面試官出的編程題,用Python實現Elasticsearch對CSV文件的分詞。 1. 環境搭建(Windows) 1.1 Python安裝 略 1.2 安裝Elasticsearch(全文搜索引擎)和Kibana(管理工具)

原创 Flask-MongoDB

原文地址:FLask擴展系列(五)-MongoDB(思誠之道) 簡介 MongoDB是一個文檔型數據庫,它靈活的Schema,多層次的結構和JSON格式的文檔使得其已經成爲了NoSQL陣營的領頭羊。 Flask的MongoDB擴

原创 Whoosh如何搜索--進階版

官方文檔:https://whoosh.readthedocs.io/en/latest/searching.html 一旦創建了索引並向其中添加了文檔,就可以搜索這些文檔。 目錄: searcher對象 Resulted對象

原创 Python:使用lambda應對各種複雜情況的排序,包括list嵌套dict

轉載自:Penguin 一、需要用到的函數 需要用到的函數很少,基本上就是sorted()和lambda。 sorted() sorted()函數原型: sorted(iterable[,key][,reverse]) 可見so

原创 製作Ubuntu的USB啓動盤(U盤)

參考文章: https://blog.csdn.net/u013553529/article/details/78307520 https://blog.csdn.net/Allyli0022/article/details/8

原创 Kibana打不開及解決辦法

過了一個別人感覺很漫長,我卻很享受的假期(我的大學生活好像一致都是這麼過來的……),忽然發現自己的Kibana打不開了(然後閃退),在elasticsearch中報錯如下: java.security.AccessControlE

原创 Python將字符串轉換成ObjectId類型

MongoDB自動生成的_id是ObjectId類型的。 我需要將MongoDB的_id存到ElasticSearch中,而ElasticSearch又只能存String類型的_id,所以就涉及到兩種類型的轉換。 Object

原创 中科院大數據部Python開發面試題

1. 寫出如下代碼的輸出結果: a = 1 def fun(a): a=2 fun(a) print(a) # 輸出____ a = [] def fun(a): a.append(1) fun(a) fun(

原创 Python下載離線安裝包

由於保密要求,必須在離線環境下開發,所以需要手動下載Python的離線安裝包,然後再安裝到保密電腦上。 以前想下載庫,直接pip install package就得了,離線安裝才發現,原來想安裝一個庫不能僅僅需要庫本身1個安裝包,

原创 卸載Docker

1.卸載Docker Engine,CLI和Containerd軟件包 sudo apt-get purge docker-ce docker-ce-cli containerd.io 2.刪除數據 主機上的映像,容器,卷或自定義

原创 安裝Docker方式二:使用存儲庫安裝

方法一:Docker官網下載安裝Ubuntu版本的Docker Docker官方文檔:https://docs.docker.com/engine/install/ubuntu/ 1.設置存儲庫 # 更新apt軟件包索引以允許ap

原创 Ubuntu安裝Docker方式一:軟件包安裝

0.卸載舊版本Docker 安裝前需要先卸載老版本的Docker。 sudo apt-get remove docker docker-engine docker.io containerd runc 注意:這種方式每次升級都需要

原创 配置鏡像站(Docker加速)

方式一:使用DaoCloud加速 網址:https://www.daocloud.io/mirror curl -sSL https://get.daocloud.io/daotools/set_mirror.sh | sh -s

原创 GitHub下載項目加速(昇華版)

現狀:一個痛點 衆所周知,GitHub 是一個巨大的開源寶庫,以及程序員和編程愛好者的聚集地,包括我之前推薦的諸多優秀的開源項目全部都是位於 GitHub 上。 但是每當我們看到優秀的開源項目,準備去下(bai)載(piao)時,

原创 Dockerfile基礎指令詳解

一、基礎指令 FROM 格式: FROM <image> FROM <image>:<tag> 解釋: FROM是Dockerfile裏的第一條而且只能是除了首行註釋之外的第一條指令。 MAINTAINER 格式: