原创 《利用Python進行數據分析》Chapter 7

在數據分析和建模的過程中,大量的時間花在數據準備上:加載、清理、轉換和重新排列。這樣的工作佔了分析師80%以上的時間。 本章內容主要講解pandas中用於缺失值、重複值、字符串操作和其他分析數據轉換的工具。 1. 處理缺失值 pa

原创 《利用Python進行數據分析》Chapter 5

本章主要介紹pandas數據結構和基本操作。 Numpy適合處理同質型的數值類數組數據,而 pandas是用來處理表格型或異質型數據的,經常和其他數值計算工具,比如NumPy和Scipy,以及可視化工具matplotlib一起使用

原创 《利用python進行數據分析》Chapter 3

本章主要介紹python的常用數據結構以及函數的用法。 1. 數據結構和序列 1.1 元組 一種固定長度、有序且不可變的python對象序列。 tup = (4,5,6) 支持+號連接以及*號直接複製多個。 1.2 列表

原创 《利用python進行數據分析》Chapter 8

本章主要內容爲對存在於不同文件的數據或者以不易於進行分析的格式存儲的數據進行數據聯合、連接以及重新排列。 1. 分層索引 pandas的多層索引,即允許在一個軸向上擁有多個(兩個或兩個以上)索引層級。分層索引可以看作一種在更低維度

原创 《利用Python進行數據分析》Chapter 6

本章主要介紹pandas對數據分輸入和輸出。通常有以下幾種類型:讀取文本文件及硬盤上其他更高效的格式文件、從數據庫載入數據、與網絡資源進行交互(比如Web API)。 1. 文本格式數據的讀寫 使用最多的函數: read_csv

原创 《利用python進行數據分析》Chapter 4

本章着重介紹NumPy基礎知識。 由於NumPy提供了一個非常易用的C語言API,可以將數據傳遞給用底層語言編寫的外部類庫,再由外部類庫將計算結果按照NumPy數組的方式返回。這個特徵使得Python可以對存量C/C++/Fort

原创 《利用Python進行數據分析》Chapter 1

本章內容爲全書學習的準備工作,主要介紹了一下部分內容。 1. 數據的類型 表格型數據 多維數組(矩陣) 相關聯的多張表(主鍵和外鍵) 時間序列 2. Python進行數據分析的優缺點 解釋型語言、膠水語言 效率低 全局解釋器鎖(G

原创 Python字符串格式化的方法

轉載 點贊 收藏 分享 文章舉報 Luuuuuuuuuuke 發佈了5 篇原創文章 · 獲贊 0 · 訪問量 316 私信

原创 cmd進入指定目錄

方法一: 分兩步,首先進入相應盤: C:\Users\xxxx>d: 然後進入相應目錄: D:>cd test D:\test> 方法二: 使用cd命令直接進入目錄 C:\Users\xxxx>cd /d d:\test D:\t

原创 《利用Python進行數據分析》Chapter 2

本章內容主要介紹了ipython的常用命令以及python語言基礎知識。 1. Ipython基礎 特點 相比於python自帶的ide,ipython可讀性更好一點,支持tab鍵補全(命名空間以及輸入歷史等),以及執行任意代碼塊

原创 格式化字符串佔位符的三種方法

轉載 點贊 收藏 分享 文章舉報 Luuuuuuuuuuke 發佈了5 篇原創文章 · 獲贊 0 · 訪問量 312 私信