原创 c++重拾 STL之heap(堆)

文章目錄0、誤區!1、heap2、heap操作的四個函數:建立堆在堆中添加元素在堆中刪除元素堆排序3、例1:基本操作的使用4、應用:數據流中的中位數 0、誤區! 1、堆排序排完後的堆和大頂堆、小頂堆不是一個概念! 2、堆分爲大頂堆

原创 如何上傳數據到集羣的HDFS上

直接甩例子,如下。 背景 我windows機子上有一個rai_4m1.txt文件。 我要將它傳到一個hadoop集羣上去,放到hdfs上。 集羣中有一臺機器,地址爲192.168.0.41。 借用工具 1、Xftp 傳文件從一臺機

原创 C++中多態由淺到深理解

文章目錄多態怎麼寫多態多態的實現:by虛函數什麼時候要聲明爲虛函數?虛函數的目的?虛函數virtual function的實現機制——虛函數表Virtual table爲什麼虛函數效率低?虛函數的入口地址和普通函數有什麼區別?  

原创 mysql統計字段不同值數量之sum(case...when)

話不多說,直接舉例咋用。 先知道一下常用語法: sum(case 屬性名 when 屬性值1 then 1 else 0 end),意思就是某個屬性下爲屬性值1就加1個數量,否則就作0統計。 看我的表players的長相: 1、

原创 pandas的apply函數使用

這個函數很有用,隔一段時間不用就老忘記,在這裏舉例總結一下。 apply函數可以對DataFrame對象進行操作,既可以作用於一行或一列的元素。 使用例子 1、常常作用於列元素 問題一:sales是一個Dataframe表格,它有

原创 mysql之rank() over(order by)、rank() over(partition by order by)

一、準備工作 創建一個表palyers: CREATE TABLE `players` ( `pid` int(2) NOT NULL AUTO_INCREMENT, `name` varchar(50) NOT NULL

原创 歸併排序、快速排序c++實現

歸併排序 假定由小到大排。 1、思想: 分解:二分爲左右兩部分; 遞歸地對兩邊歸併:對左邊歸併,對右邊歸併 合併:合併左右爲一個。 2、code: 輸入: 6 60 90 50 30 20 40 輸出: 20 30 40 50 6

原创 pandas.concat實現豎着拼接、橫着拼接DataFrame

1、concat豎着拼接(默認的豎着,axis=0) 直接看例子: import pandas as pd df1=pd.DataFrame([10,12,13]) df2=pd.DataFrame([22,33,44,55])

原创 c++讀一行數字以換行結束,讀一行句子以換行結束

基礎 1、getchar() 頭文件#include<cstdio>中 從標準輸入讀下一個字符。原返回int(如輸入a,函數返回97)。 2、getline() 讀入一行字符串,以換行結束。 應用:實現輸入 1、讀一行整數,以換行

原创 c++ STL String搜索操作及例子

6個不同的搜索函數 查找s中args第一次出現的位置:s.find(args) 在s中找args中任意一個字符第一次出現的位置:s.find_first_of(args) 在s中查找第一個不在args中的字符:s.find_fi

原创 爲什麼在很多應用中常採用正態分佈/高斯分佈

當我們由於缺乏關於某個實數上分佈的先驗知識而不知道該選擇怎麼樣的形式時,正態分佈是默認的比較好的選擇,有兩個原因: 一,我們想要建模的很多分佈的真實情況是比較接近正態分佈的。 中心極限定理說明很多獨立隨機變量的和近似服從正態分佈。 二

原创 工業界推薦系統整體架構瞭解

文章目錄工業推薦系統一般分三部分:在線+近線+離線部分召回的主要職責是什麼?爲什麼要做召回?爲什麼召回上的是簡單模型?排序階段上的是複雜模型?多路召回怎麼做?概念補充:協同過濾:A/B測試: 工業推薦系統一般分三部分:在線+近線+離線

原创 c++重拾 STL之heap(堆)使用

文章目錄0、誤區!1、heap2、heap操作的四個函數:建立堆在堆中添加元素在堆中刪除元素堆排序 0、誤區! 1、堆排序排完後的堆和大頂堆、小頂堆不是一個概念! 2、堆分爲大頂堆和小頂堆,即要麼大頂堆(大根堆/最大堆),要麼小頂堆。

原创 pandas.discribe統計特徵值們的輸出格式設置

直接pd.discribe()輸出出來,是科學計數法形式的,有的時候看這些統計值的結果非常地不直觀。 怎麼設置一下呢?我搜了半天沒有搜到,我把它記在這: 用pd.set_option()函數:pd.set_option('displa

原创 來自行星模型的啓發——談模型之簡單與複雜

讀《數學之美》一書,作者談行星模型,受到啓發,我想談談數據挖掘建模中的模型複雜度問題。 托勒密的地心說模型,大圓套小圓,十分複雜,然而模型是錯誤的;開普勒的日心說模型,橢圓模型,模型簡單,並且模型是正確的。 我想到了機器學習中的一個名