面向機器學習初學者的50大問答題 ---Adam Studio

50 machine learning questions & answers for Beginners

在這裏插入圖片描述

import matplotlib.animation as animation
from matplotlib.figure import Figure
import plotly.figure_factory as ff
import matplotlib.pylab as pylab
from ipywidgets import interact
import plotly.graph_objs as go
import plotly.offline as py
from random import randint
from plotly import tools
import seaborn as sns
import pandas as pd
import numpy as np
import matplotlib
import warnings
import string
import numpy
import csv
import os

1-how to import your data?

What you have in your data folder?

print(os.listdir("../input/"))

在這裏插入圖片描述

import all of your data

titanic_train=pd.read_csv('../input/train.csv')
titanic_test=pd.read_csv('../input/test.csv')

Or import just %10 of your data

titanic_train2=pd.read_csv('../input/train.csv',nrows=1000)

How to see the size of your data:

print("Train: rows:{} columns:{}".format(titanic_train.shape[0], titanic_train.shape[1]))

在這裏插入圖片描述

2- How to check missed data?

titanic_train.isna().sum()

在這裏插入圖片描述
or you can use below code

total = titanic_train.isnull().sum().sort_values(ascending=False)
percent = (titanic_train.isnull().sum()/titanic_train.isnull().count()).sort_values(ascending=False)
missing_data = pd.concat([total, percent], axis=1, keys=['Total', 'Percent'])
missing_data.head(20)

在這裏插入圖片描述

3- How to view the statistical characteristics of the data?

titanic_train.describe()

在這裏插入圖片描述
or just for one column

titanic_train['Age'].describe()

在這裏插入圖片描述
with a another shape

titanic_train.Age.describe()

在這裏插入圖片描述

4- How check the column’s name?

titanic_train.columns

在這裏插入圖片描述
or you can the check the column name with another ways too

titanic_train.head()

在這裏插入圖片描述

5- how to view randomly your data set ?

titanic_train.sample(5)

在這裏插入圖片描述

6-How random row selection in Pandas dataframe?

titanic_train.sample(frac=0.007)

在這裏插入圖片描述

7- How to copy a column and drop it ?

PassengerId=titanic_train['PassengerId'].copy()
PassengerId.head()

在這裏插入圖片描述

type(PassengerId)

在這裏插入圖片描述

titanic_train=titanic_train.drop('PassengerId',1)
titanic_train.head()

在這裏插入圖片描述

titanic_train=pd.read_csv('../input/train.csv')

8- How to check out last 5 row of the dataset?

we use tail() function

titanic_train.tail() 

在這裏插入圖片描述

9- How to concatenation operations along an axis?

all_data = pd.concat((titanic_train.loc[:,'Pclass':'Embarked'],
                      titanic_test.loc[:,'Pclass':'Embarked']))
all_data.head()

在這裏插入圖片描述

titanic_train.shape

在這裏插入圖片描述

titanic_test.shape

在這裏插入圖片描述

all_data.shape

在這裏插入圖片描述

10- How to see unique values for a culomns?

titanic_train['Sex'].unique()

在這裏插入圖片描述

titanic_train['Cabin'].unique()

在這裏插入圖片描述

titanic_train['Pclass'].unique()

在這裏插入圖片描述

11- How to perform some query on your datasets?

titanic_train[titanic_train['Age']>70]

在這裏插入圖片描述

titanic_train[titanic_train['Pclass']==1]

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章