原创 機器學習常見算法概述

本文主要包括常見機器學習算法的實現,其中數學推導、原理、並行實現會給出鏈接。 機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。專門研究計算機

原创 一些比較有意思的題目

1.從一個n位數中尋找m位數,並輸出最小值 來源:面試一家創業公司的題目 Example 輸入:698592 k = 4 輸出 :6592 Solution:一種比較常見的思路是枚舉全部k=4的數字,然後再取最小值,然而

原创 C++ 編譯、鏈接

C++程序在編譯的時候主要有以下幾個過程: 1.預編譯(預處理):主要是對僞指令(以#開頭的指令)和特殊符號進行處理。 僞指令主要包括: (1)宏指令:如#define NAME ADU,#undef等。對於第一個指令,預編譯主

原创 暴力枚舉法專題

聲明:題目均來自Leetcode,本文旨在學習 1.Subsets Given a set of distinct integers, nums, return all possible subsets. Note: The so

原创 梯度下降、牛頓法、擬牛頓法

介紹 在向量微積分中,標量場的梯度是一個向量場。標量場中某一點上的梯度指向標量場增長最快的方向,梯度的長度是這個最大的變化率。更嚴格的說,從歐幾里得空間Rn到R的函數的梯度是在Rn某一點最佳的線性近似。 在判別式模型中,我們往

原创 C++ vector 實現二維數組

簡介 在STL中Vector這一容器,無論是在封裝程度還是內存管理等方面都由於傳統C++中的數組。本文主要是關於使用Vector初始化、遍歷方面的內容。其他二維的思想也是類似的。 這裏簡單敘述一下C++ 構建二維動態數組 int

原创 線程、進程

線程、進程方面學習筆記整理 1、線程的基本概念 線程是進程中執行運算的最小單位,是進程中的一個實體,是被系統獨立調度和分派的基本單位,線程自己不擁有系統資源,只擁有一點在運行中必不可少的資源,但它可與同屬一個進程的其它線程共享進

原创 C/C++基本知識點

1.C中static有什麼作用 (1)隱藏。當我們同時編譯多個文件時,所有未加static前綴的全局變量和函數都具有全局可見性,故使用static在不同的文件中定義同名函數和同名變量,而不必擔心命名衝突。 (2)static的第二

原创 海量數據處理

本文轉自結構之法算法之道blog 1、何謂海量數據處理? 所謂海量數據處理,其實很簡單,海量,海量,何謂海量,就是數據量太大,所以導致要麼是無法在較短時間內迅速解決,要麼是數據太大,導致無法一次性裝入內存。 那解決辦法呢?針對時間

原创 C++ 智能指針

介紹 C++提供了4種智能指針用於對分配的內存進行自動釋放,這些智能指針如下:auto_ptr、unique_ptr、shared_ptr、weak_ptr。其中auto_ptr在C++98標準引入,後三種在C++11標準中加入

原创 模型融合

本文包括常見的模型融合方法、代碼鏈接、進階的思路。 1.線性加權融合方法 從算法的角度來看,則最常用的是採用加權型的混合推薦技術,即將來自不同推薦算法生成的候選結果及結果的分數,進一步進行組合(Ensemble)加權,生成最終的推

原创 2017校招面經(BAT、搜狗、搜狐、一點資訊、360、華爲優招)

總體流程:簡單介紹下自己、各個公司面經、總結、薪資 1.簡單介紹 面試崗位:機器學習 | 數據挖掘 | 算法工程師 | 基礎研究 比賽經歷:天池比賽Top 10,滴滴算法大賽Top 5,京東算法大賽Top 1 科研經歷:實驗室主要

原创 NumPy手冊

NumPy(Numerical Python的簡稱)是高性能科學 和數據分析的基礎包。 其重要功能如下: 1. ndarray,一個具有矢量運算和複雜廣播能力的快速且節省空間的多維數組。 2. 用於對數組數據進行快速運算的標準

原创 網易2017校園招聘數據挖掘筆試題

剛剛做完筆試題,感覺網易筆試編程題有難度,貼出題目,有時間做做。 1.藏寶圖 題目描述 牛牛拿到了一個藏寶圖,順着藏寶圖的指示,牛牛發現了一個藏寶盒,藏寶盒上有一個機關,機關每次會顯示兩個字符串s和t,根據古老的傳說,牛牛需

原创 MapReduce入門

介紹 本文理論部分主要是Google MapReduce,配置&使用是依託阿里雲平臺。 MapReduce是一種編程模型,用於大規模數據集(大於1TB)的並行運算。概念”Map(映射)”和”Reduce(歸約)”,是它們的主要思