原创 python,datetime 時間格式化輸出

import datetime,re def parse_date(date_str): try: if not date_str: return None if "-" in

原创 POSTGIS,常用函數,實例

alter table public.dianping_qinzi add column geom geometry; 單點 來生成 geom 用st_pointfromtext 函數: update public.dianpin

原创 jieba分詞以及word2vec詞語相似度

去除 標點符號, 下一步 開始文本相似度計算: 參考文章 : http://www.jb51.net/article/139690.htm from gensim.models import Word2Vec model = W

原创 python異常處理

import re,random,traceback kk ='<img src="//kanimg.9ku.com/Article/20170727/1501135687683763.gif" alt="不要惹怒胖子,後果自己看">'

原创 pandas處理大數據的技巧

refer : https://yq.aliyun.com/articles/530060?spm=a2c4e.11153940.blogcont181452.16.413f2ef21NKngz# http://www.datayuan.

原创 hadoop--Hadoop生態上幾個技術的關係與區別:hive、pig、hbase 關係與區別

Pig 一種操作hadoop的輕量級腳本語言,最初又雅虎公司推出,不過現在正在走下坡路了。當初雅虎自己慢慢退出pig的維護之後將它開源貢獻到開源社區由所有愛好者來維護。不過現在還是有些公司在用,不過我認爲與其使用pig不如使用hive。:)

原创 Doc2Vec,Word2Vec文本相似度 初體驗。

參考資料 : https://radimrehurek.com/gensim/models/word2vec.html 接上篇 : import jieba all_list = jieba.cut(xl['工作內容'][0:6],cut

原创 Python文本處理: 分詞和詞雲圖

''' import os import jieba # 分詞包 import numpy # numpy計算包 import codecs # codecs提供open方法指定打開的文件的語言編碼,它會在讀取時自動轉換爲內部的uni

原创 pandas與函數的處理

pandas和excel的對應關係 : http://blog.51cto.com/13000661/2132895 這個Series交給函數map後 返回的item,怎麼用split 拆分成2列,再插入df中呢。。? new_df1

原创 python進階

5、and 和 or and返回第一個假值,如果都爲真,返回最後一個真值。 or返回第一個真值,如果都爲假,返回最後一個假值。 複製代碼 >>> a = "first" >>> b = "second" >>> 1 and a or

原创 Hyperopt調參時: 'generator' object is not subs

原因與解決方案 思考 :pip 裝的時候就有警告 ,所以最先考慮的是類庫問題,但是是在找不到是那個類庫的問題,查了Hyperopt源碼也沒什麼用.大概僵持了二十分鐘,決定還是去Github查查issues.確實找到了解決方案. 原因與解決

原创 pandas 操作-2

增加一行 方法1 : 方法 2 : 修改某行某列的值 頻率 , 頻數 》

原创 sql題 --

需求 : 分月 統計訪問人數 : 截取 從1開始 取7個字符長度 。 原始數據 如右邊 所示 : 成功 : refer : https://blog.csdn.net/mrbcy/article/details/689538

原创 P2P中的 RFM模型如何實際應用

https://www.zhihu.com/question/49439948/answer/130220645 RLMF的模型那我們再回到客戶關係裏來,做一個簡單的模型。圖表顯示了從客戶第一次購買到上一次購買的時間軸,柱狀圖代表了客戶

原创 DC比賽員工離職預測訓練賽(邏輯迴歸)

先 去掉些不要的列。 (2)Attrition:員工是否已經離職, 數量和部門的 關係。 薪酬水平與離職率的疊加條形圖 。 注意,對象爲object類型,會導致 後面運行出錯, 發現, 改變 樣本和測試集 比例 會影響分數,