原创 python推薦系統庫-surprise

@ 2018-01-24 Surprise 簡單易用同時支持多種推薦算法 其中基於近鄰的方法協同過濾可以設定不同的度量準則 支持不同的評估準則 使用示例 基本使用方法如下 載入自己的數據集方法 算法調參讓推薦系統有更好的效果 在自己的數據

原创 單向鏈表每k個元素翻轉一次

給出一個鏈表,每 k 個節點一組進行翻轉,並返回翻轉後的鏈表。 k 是一個正整數,它的值小於或等於鏈表的長度。如果節點總數不是 k 的整數倍,那麼將最後剩餘節點保持原有順序。 示例 : 給定這個鏈表:1->2->3->4->5 當 k =

原创 Python關鍵字

今天依舊在啃:《笨方法學python》,其中習題37是複習各種關鍵字。我本想百度一下記一下就ok了,但是百度出來第一個就Hongten的博客。我才意識到我也有博客,我應該學習他,把這些積累的東西都放到博客中。 主要參考:http://ww

原创 Hive SQL優化

本章只是從HQL層面介紹一下,日常開發HQL中需要注意的一些優化點,不涉及Hadoop層面的參數、配置等優化。 1 使用分區剪裁、列剪裁 在SELECT中,只拿需要的列,如果有,儘量使用分區過濾,少用SELECT *。 在分區剪裁中,當使

原创 TensorFlow實現簡單卷積神經網絡-MNIST手寫數字識別

# -*- coding:utf-8 -*- import tensorflow as tf import numpy as np from tensorflow.examples.tutorials.mnist import inpu

原创 AI必知的十大深度學習算法

首先先讓我們來定義一下什麼是“深度學習”。對很多人來說,給“深度學習”下一個定義確實很有挑戰,因爲在過去的十年中,它的形式已經慢慢地發生了很大的變化。 先來在視覺上感受一下“深度學習”的地位。下圖是AI、機器學習和深度學習三個概念的一個關

原创 機器學習算法介紹

前言 谷歌董事長施密特曾說過:雖然谷歌的無人駕駛汽車和機器人受到了許多媒體關注,但是這家公司真正的未來在於機器學習,一種讓計算機更聰明、更個性化的技術。 也許我們生活在人類歷史上最關鍵的時期:從使用大型計算機,到個人電腦,再到現在的雲計算

原创 FM算法(一):算法理論

主要內容: 動機 FM算法模型 FM算法VS 其他算法   一、動機 在傳統的線性模型如LR中,每個特徵都是獨立的,如果需要考慮特徵與特徵直接的交互作用,可能需要人工對特徵進行交叉組合;非線性SVM可以對特徵進行kernel映射,但是在特

原创 Python機器學習實踐指南-第四章(1)

由於第三章的國外網站無法翻牆,拿不到數據。故跳過第三章,直接進行第四章. 由於篇幅較長,故分篇章實現。 PS:這次下週的數據截止到2019年2月的數據,和書上的數據相比數據有小量增加。出現的問題也比較多,在嘗試處理。如果有做的不對或者不合

原创 Python機器學習實踐指南-第二章

# # -*- coding:utf-8 -*- #準備數據 import pandas as pd import re import numpy as np import matplotlib.pyplot as plt plt.st

原创 Pyhon機器學習實踐指南-第一章

# # -*- coding:utf-8 -*- import os import pandas as pd import requests """ 先下載iris.data數據集,並寫入path目錄。實際上下載的是.csv文件,但

原创 協同算法總結

    推薦算法具有非常多的應用場景和商業價值,因此對推薦算法值得好好研究。推薦算法種類很多,但是目前應用最廣泛的應該是協同過濾類別的推薦算法,本文就對協同過濾類別的推薦算法做一個概括總結,後續也會對一些典型的協同過濾推薦算法做原理總結。

原创 word2vec中數學原理詳解以及原理思考

            很久沒有寫博客了,也沒有寫過相關總結。最近,工作中又開始用到了word2vector,正好就做個相關總結。這方面相關的博客有很多,我看過的講的最清楚的就是@peghoty的博客。 要理解wordvector的原理

原创 Spark 快速大數據分析 -垃圾郵件分類示例

垃圾郵件分析是一個用來快速瞭解MLlib的例子。這個程序用了兩個函數:HashingTF與LogisticRegressionWithSGD,前者從文本數據構建詞頻(termfrequency)特徵向量,後者使用隨機梯度下降法實現邏輯迴歸

原创 循環神經網絡(RNN)模型與前向反向傳播算法

    在前面我們講到了DNN,以及DNN的特例CNN的模型和前向反向傳播算法,這些算法都是前向反饋的,模型的輸出和模型本身沒有關聯關係。今天我們就討論另一類輸出和模型間有反饋的神經網絡:循環神經網絡(Recurrent Neural N