原创 list數據隨機切分7:3

import random def split(full_list,shuffle=False,ratio=0.2):     n_total = len(full_list)     offset = int(n_total * rat

原创 推薦系統入門資料

一、相關會議 1.與推薦系統直接相關的會議: RecSys -The ACM Conference Series on Recommender Systems. 2.數據挖掘相關會議: SIGKDD - The ACM SIGKDD Co

原创 推薦系統綜述

一、什麼是推薦系統: 根據用戶需求、興趣等,通過推薦算法從海量數據中挖掘出用戶感興趣的項目(如信息、服務、物品等),並將結果以個性化列表的形式推薦給用戶。推薦系統的核心是推薦算法,它利用用戶與項目之間的二元關係,基於用戶歷史行爲記錄或相似

原创 數字水印問題總結

1.從鍵盤讀取的字符串遇到空格截斷? 採用cin讀取輸入方法遇到空格,默認輸入結束;用cin.getline()讀取一行; 2.用凱撒算法加密字符串,中文無法加密? 將ASCII編碼的字符串轉換爲UTF-8編碼或者Unicode編碼 3.

原创 EM算法再次總結

轉載自:https://blog.csdn.net/xueyingxue001/article/details/52020673         說明:此篇是作者對“EM”的第二次總結,因此可以算作對上次總結的查漏補缺以及更進一步的

原创 EM算法 - 1 - 介紹

轉自:https://blog.csdn.net/xueyingxue001/article/details/51374100 聲明:          1,本篇爲個人對《2012.李航.統計學習方法.pdf》的學習總結,不得用作商

原创 第4章 樸素貝葉斯法

概述 樸素貝葉斯法是基於貝葉斯定理與特徵條件獨立假設的分類方法。對於給定的訓練數據集,首先基於特徵條件獨立假設學習輸入/輸出的聯合概率分佈;然後基於此模型,對給定的輸入x,利用貝葉斯定理求出後驗概率最大的輸出y。 一、全概率公式和貝葉斯公

原创 第1章 統計學習方法概論

1.什麼是統計學習 OR 統計機器學習 OR 機器學習?         =計算機基於數據構建概率統計模型,並運用模型對數據進行預測與分析(統計學習的目的)。         統計學習就是計算機系統通過運用數據及統計方法提高系統性能的機器

原创 第2章 感知機

1.概述:感知機(perceptron)是二分類的線性分類模型,其輸入爲實例的特徵向量,輸出爲石磊的類別,取+1和-1.感知機對應於輸入空間(特徵空間)中將數據進行劃分的分離超平面,屬於判別模型。感知機學習旨在求出將訓練數據進行劃分的分離

原创 第3章 k近鄰法

3.1 概述 k近鄰法(k-nearest neighbor,KNN)是一種基本分類與迴歸方法。這裏只討論分類問題中的k近鄰法。 該方法的思路:假設給定一個訓練數據集,其中的實例類別已定。分類時,對新的實例,根據其k個最近鄰的訓練實例的類

原创 Unable to locate appropriate constructor on class原因分析

通常我們喜歡將hql查詢結果封裝到POJO對象  syntax:  select new POJO(id,name) from POJO ;  這種封裝需要POJO類提供對應構造器,POJO(id,name)構造方法。    但