原创 pandas實用函數

一  統計彙總函數: import pandas as pd s = pd.Series() s.min    s.max s.sum s.mean s.count  # 非缺失元素的個數 s.size   #所有元素的個數 s.medi

原创 sort函數和sorted函數的異同

sort函數和sorted函數都是python內置的排序函數。那爲什麼會有2個排序函數呢? 總結一下,雖然都是內置的排序功能,但是還是有差異的。 1 sort原位排序,無返回值;sorted保留原對象,返回一個排序完的對象。 2 sort

原创 excel文件轉dataframe轉存mysql並計算

excel文件轉存mysql數據庫 主力函數爲 conn = create_engine("mysql+pymysql://root:123@localhost/stock_investment",encoding='utf-8')  

原创 爬取滬深股票並找出最近1個月創出新高的股票

import requests from lxml import etree import re import pandas as pd result = set() # 獲取滬市股票代碼(6開頭) web = requests.g

原创 微信聊天記錄製作詞雲圖

1 使用iTunes 備份iphone; 2在C:\Users\xxxx\AppData\Roaming\Apple Computer\MobileSync\Backup路徑中找到備份文件夾 3打開備份文件夾找到其中的Manifest.d

原创 join語句的過程

如果有2個大小不同的表做join,應該用哪個表來做驅動表? 我們先設計2個相同的表結構,一個大表插入一萬條數據,一個小表插入一千條數據。 CREATE TABLE `small_table` (     `A` INT(11) NOT N

原创 datetime,timestamp和str的互相轉化

一 datetime,timestamp和Timedelta datetime以毫秒形式存儲日期和時間。而datetime.timedelta表示兩個datetime對象之間的時間差。可以給datetime對象加上或減去一個或多少time

原创 重塑比特幣數據並作K線圖

import matplotlib.pyplot as plt from mpl_finance import candlestick_ohlc import pandas as pd from matplotlib.pylab imp

原创 MySQL查詢緩存和緩衝池的區別

一 緩衝池 在InnoDB存儲引擎中,一部分數據會被放到內存中,緩衝池則佔了這部分內存的大部分,它用來存儲各種數據的緩存,包括: 數據頁,插入緩存,自適應索引哈希,索引頁,鎖信息,數據字典信息等。 InnoDB存儲引擎基於磁盤文件存儲,訪

原创 SQL語句執行得慢的原因

討論一下SQL語句執行得慢的原因有哪些。 1 偶爾很慢 i:那麼數據庫可能在刷髒頁。redo log寫滿了需要同步到磁盤。 (InnoDB在處理更新語句的時候,只做了一個寫redo log的操作。redo log寫滿了就需要同步到磁盤)

原创 數據分析———作圖

比較:比較數據間各類別的關係,或者是它們隨着時間的變化趨勢,比如折線圖 聯繫:查看兩個或兩個以上變量之間的關係,比如散點圖 構成:每個部分佔整體的百分比,或者是隨着時間的百分比變化,比如餅圖 分佈:關注單個變量,或者多個變量的分佈情況,比

原创 作比特幣量價圖以及N日均線

import matplotlib.pyplot as plt from mpl_finance import candlestick_ohlc import pandas as pd from matplotlib.pylab imp

原创 python的淺拷貝,影子拷貝和深拷貝

一  淺拷貝,也叫淺複製,是引用傳遞。 比如有2個列表,l1=[1,2,3],l2=l1,這就是淺拷貝,他們共同指向同一塊內存地址。 既然他們指向同一塊內存,那麼你修改其中一個列表的值,自然另一個列表的值也被修改了。 如果不希望修改一個

原创 python中__init__ 和__new__的區別

__new__是一個類方法,它返回的是一個實例 __init__是一個實例方法,它什麼都不返回(如果返回None之外的東西會報錯) 事實上,創建一個類分2步。第一步,創建類的對象,就是new;第二步對類進行初始化,就是init 只有在_

原创 super的用法和注意事項

super第一個參數是指定調用誰的直接父類, 第二個參數指定當調用時,傳遞什麼作爲方法的第一個參數,一般如果是實例方法的話第一個參數是self,類方法的話第一個參數爲cls 如果子類直接調用 父類的方法,可以直接默認使用super()即可