原创 python實現統計文本中單詞出現的頻率詳解

這篇文章主要介紹了python統計文本中單詞出現頻率,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨着小編來一起學習學習吧 本文實例爲大家分享了python統計文

原创 Python多線程應用

內容: 設計兩個界面,分別實現登錄和學生信息錄入功能。 數據庫中創建Uers和student兩個表,分別用來存儲用戶信息及學生信息。 登錄界面輸入用戶名和密碼,根據輸入內容分別給出“用戶名不存在”,“密碼錯誤”等錯誤提示。正確登錄後則進

原创 centos6.5下配置hbase

1.下載並解壓hbase的安裝包,此版本爲hbase-1.0.0-cdh5.6.0.tar2.若未安裝zookeeper,則先安裝zookeeper。安裝文件名:zookeeper-3.4.5-cdh5.6.0.tar.gz下載地址:點擊

原创 centos6.5安裝hadoop集羣過程及遇到的問題

1.hadoop安裝過程及命令 1.1安裝虛擬機 打開VMware,新建虛擬機,安裝cent os6.5系統,網絡連接選擇NET,爲虛擬機命名爲master,將虛擬磁盤存儲成單個文件。 1.2設置虛擬機 啓用虛擬機共享文件夾,瀏覽本機上的

原创 基於Python的網絡爬蟲

一個爬蟲的架構包括URL管理器,網頁下載器,和網頁解析器,管理待抓取的URL集合和已抓取URL集合,這樣是爲了防止重複抓取和循環抓取。 網頁下載器 將互聯網上URL對應的網頁下載到本地的工具。 網頁解析器 將下載的網頁按照某種網頁形

原创 自學linux筆記

1.虛擬機1.1虛擬機的使用(1)如果真的想學linux系統,就不要使用鏡像安裝系統。在新建虛擬機時,選擇“我以後安裝操作系統 “,然後選擇一個客戶端操作系統,初學建議選擇32位。(2)虛擬機其實是一個文件,直接刪文件夾即可。但是當要卸載

原创 Python技術實現一個完整的任務需求

簡介 題目:經理管理上市菜品數據庫 經理要進行登錄驗證,用戶名和密碼與數據庫中匹配纔可進入 登錄成功後經理可進行三種操作:查詢,增加,刪除查詢:輸入命令select,查詢結果會寫入文件,並且顯示在客戶端增加:輸入命令add,每條記錄以逗號

原创 hive實現50w詞頻統計與ctrip數據集銷售額計算

用hive對50萬條記錄(數據文件demo50w.utf8)進行詞頻統計,數據清洗轉換自行處理,並列出詞頻最高的20個詞。 首先準備好要統計單詞的文件,並上傳到hdfs上,登錄hive,先創建一個表,這個表中只有一列數據,類型爲strin

原创 centos6.5安裝mongodb

安裝mongodb-3.6.4版本。執行命令$wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel62-3.6.4.tgz如果出現錯誤:則在root下更新wget,

原创 c_str()的用法

C中沒有string,所以函數c_str()就是將C++的string轉化爲C的字符串數組,c_str()生成一個const char *指針,指向字符串的首地址。 char *p=s[10]; string a="welcome"; s

原创 python實現統計文本中單詞出現的頻率

#coding=utf-8 import os from collections import Counter sumsdata=[] for fname in os.listdir(os.getcwd()): if os.pat

原创 python實現複雜的數據結構

適合初學python時,用序列簡單模擬實現棧和隊列。#棧#coding=utf-8n=input("請輸入棧大小:")n=int(n)a=[]print("請輸入棧元素:")for i in range(n):    x=input() 

原创 C語言實現詞法分析

本程序中,事先建立一個帶有註釋的文件,這裏建立的是“a1.c”,最後的輸出寫入“a.txt”文件中。#include <stdio.h> FILE *in,*out; char ch1,ch2; int main() { if (