原创 spark Streaming從kafka消費數據遇到的問題,求解

問題: INFO JobScheduler: Added jobs for time 消費kafka數據的過程中,有時候會一直出現 INFO JobScheduler: Added jobs for time ,百度說的是設置的單

原创 spark原理概念

spark有哪些組件: master:管理集羣和節點,不參與計算 worker:計算節點,進程本身不參與計算,向master心跳(不包含節點資源) Driver:運行程序的main方法,創建spark context對象 spark

原创 龍應臺:孩子,我爲什麼要求你讀書?

全文如下: 本文是龍應臺記錄下兒子21歲時他們的一場對話。她寫給兒子安德烈的一段話也在微信微博上瘋轉:孩子,我要求你讀書用功,不是因爲我要你跟別人比成績,而是因爲,我希望你將來會擁有選擇的權利,選擇有意義、有時間的工作,而不是被迫謀生。

原创 最新pycharm激活碼

進入這個網站點擊獲得註冊碼 http://idea.lanyus.com/ 有效期爲一年

原创 hive腳本掛後臺命令

nohup sh xxx.sh xxx> xxx.log & nohup sh:.sh腳本掛後臺命令 xxx:腳本中的參數(可無) xxx.log 將日誌寫到xxx.log文件中 & 掛後臺標誌

原创 leetcode:165. 比較版本號

比較兩個版本號 version1 和 version2。 如果 version1 > version2 返回 1,如果 version1 < version2 返回 -1, 除此之外返回 0。 你可以假設版本字符串非空,並且只包含數字和

原创 scrapy爬蟲案例爬取趕集網租房信息併入庫

本案例有以下幾個步驟 1、scrapy shell 使用 2、創建scrapy項目 3、創建數據庫 4、編寫爬蟲 一、scrapy shell 使用 安裝pycharm專業版(數據庫要用到),ipython, 打開windows命令提示符

原创 Numpy練習

import numpy as np import pandas as pd from numpy import random from numpy.random import randn

原创 窮人和富人

扯幾句閒話。 想發財的人,對自己工作的要求,得按照有錢人工作的標準。 我們受的教育,貌似都是有錢人都很懶,窮人都很勤奮。比如窮人的孩子才早當家之類的。 實際上恰恰相反。 有錢人都很勤奮。 有錢人都是不敢按自己的情緒去做事的,無論

原创 matplotlib中給圖形設置文本註釋

主要方法 1.figure #標題 2.xlable() #x軸標籤 3.ylable() #y軸標籤 4.title() #圖形標題 5.text() #文本註釋 6.grid() #是否啓用方格[true/f

原创 pandas練習

更多函數查閱http://pandas.pydata.org/pandas-docs/stable/10min.html import pandas as pd #兩種數據結構 from pandas import Series,Data

原创 mysql別名的使用

在項目中遇到別名的問題,抽時間整理了一下 在sql中,合理的使用別名可以讓sql更容易寫並且提高可讀性。別名使用 as 來表示,可以分爲表別名和列別名。 別名應該是先定義後使用纔對,所以首先要了解sql的執行順序 sql執行順序如下:

原创 微信跳一跳問題總結

在測試大佬寫的python跳一跳時候剛開始就出問題了,本人用的是小米Note,總結如下: 1.python安裝,最好選用anaconda版本。anaconda集成了很多包,省去了很多不必要的麻煩。 2.安裝adb的時候出現offline

原创 我的2017--生活篇

      記得很清楚,在17年大年三十晚上,一個人躺在牀上回想着16年發生的一切,做了什麼事?去了哪裏?認識了哪些人...?很模糊的印象,很多事又好像是15年發生的......時間太快,記憶混亂不堪。       然後,我決定用手機記錄

原创 dom4j解析xml文檔全面介紹

一、dom4j介紹 dom4j是一個Java的XML API,類似於jdom,用來讀寫XML文件的。dom4j是一個非常非常優秀的Java XML API,具有性能優異、功能強大和極端易用使用的特點,同時它也是一個開放源代碼的軟件,