原创 Mysql 第 n 高的薪水 相關知識整理

目錄 題目  解題思路: 答案: 相關知識點:         題目    編寫一個 SQL 查詢,獲取 Employee 表中第 n 高的薪水(Salary)。 +----+--------+ | Id | Salary | +----

原创 Pandas 數據結構-Series

作爲自己學習的筆記,加油!  import pandas as pd      Series是一種一維的數組型對象。包含兩個屬性Series.values 和Series.index 1.1創建Series     from pandas

原创 sklearn 數據預處理

1、數據標準化          sklearn.perprocessing.scale          sklearn.preprocessing.StandScaler 2、數據縮放         2.1 MinMaxScaler

原创 Pandas-第六章缺失數據處理

  目錄 一、缺失預測及其類型 二、缺失數據的運算與分組 三、填充與剔除 四、插值 線性插值 高級插值方法 interpolate中的限制參數     一、缺失預測及其類型 瞭解缺失值信息 df.isna()  #或者df.列名.isn

原创 Pandas 第8章 分類數據

Categoricals 是 pandas 的一種數據類型,對應着被統計的變量。Categoricals 是由固定的且有限數量的變量組成的。比如:性別、社會階層、血型、國籍、觀察時段、讚美程度等等。 與其它被統計的變量相比,categor

原创 Pandas 第7章 文本數據

目錄 string 類型的性值 拆分和拼接 替換 子串匹配與提取 常用字符串方法 問題與練習 string 類型的性值 string 與object區別 字符存取方法,string返回相應數據的Nullable類型,object會因缺

原创 特徵工程

原文鏈接:https://www.cnblogs.com/jasonfreak/p/5448385.html https://www.cnblogs.com/jasonfreak/p/54483

原创 Excel 數據分析

整理與《誰說菜鳥不會數據分析》 一、重複數據處理 1、COUNTIF函數 2、高級篩選法 3、條件格式法 4、數據透視表 5、刪除重複值 二、缺失數據處理 Ctrl G 定位 + Ctrl Enter 1、用一個樣本統計量的值代替缺失值:

原创 Tensorflow 實現google深度學習框架-第二章

Tensorflow 環境搭建 2.1 Tensorflow 的主要依賴包       2.1.1Protoco Buffer        Protoc Buffer 是處理結構化數據的工具。此處結構化數據指的是擁有多種屬性的數據。比如

原创 Python 分類和標註詞彙

1.名詞解釋:     詞性標註(part-of-speech tagging ,POS tagging):將詞彙按照詞性分類並相應地對他們進行分類     詞性也稱你爲詞類,詞範疇。用於特定任務標記的集合被稱爲一個標記集。  1.1 使

原创 Python解決unicode編碼 \xe7\xbb\x87轉化爲中文

 記錄下學習過程中遇到的問題:將中文關鍵字提取後存入csv文件中,結果出現瞭如下結果: \xe7\xbb\x87\xe7\x89\xa9 \xe7\xbb\x93\xe5\x90\x88\xe9\x83\xa8 \xe7\xbb\x93\

原创 2.1載入自己的語料庫

使用PlaintextCorpusReader 載入自己的語料假設你的文件的位置:C:\cl       form nltk.corpus import PlaintCorpusReader       corpus_root=r'C:\

原创 第一章 獲取語料庫

1.獲取文本語料通過import nltk.book 訪問定義好的文本通過nltk.corpus.gutenberg.fileids()訪問古藤堡項目的文件from nltk.corpus import gutenburg       

原创 sparql 查詢例子

先說一下sparql可以做什麼? 1.可以從半結構化和結構化的數據中提取 2.通過查詢未知的關係可以挖掘數據 3.使用單一簡單的查詢在分散的數據庫中執行 4.將RDF數據轉化成其他詞語 # prefix declarations 前綴

原创 本體結構介紹

1.本體的結構 OWL是語義網活動的一個組成部分。這項工作的目的是通過對增加關於那些描述或提供網絡內容的資源的信息,從而使網絡資源能夠更 容易地被那些自動進程訪問。由於語義網絡固有的分佈性,OWL必須允許