原创 維特比算法的簡單理解——以分詞算法爲例

在中文分詞任務中,一個很棘手的問題是中文詞中字組合的複雜性。 例如句子:南京市長江大橋,這句話可以有多種分詞方法都說的通: (1)南京市/長江大橋 (2)南京/市長/江大橋 在基於規則匹配的分詞法中, 如果多種分法的詞在詞典中都能

原创 爲什麼機器學習(一)——Hessian矩陣的正定性爲什麼可以決定函數是否有極值

爲什麼機器學習(一)——Hessian矩陣的正定性爲什麼可以決定函數是否有極值 在學習機器學習的過程中,我們不可繞開的是訓練模型的時候怎麼找到損失函數的極值。 可能大家都曾記住過這樣一個結論:若M點處函數的梯度爲0,則M爲駐點,那

原创 遊離態GLZ的LeetCode刷題筆記3

3.無重複字符的最長子串 給定一個字符串,請你找出其中不含有重複字符的 最長子串 的長度。 示例 1: 輸入: "abcabcbb" 輸出: 3 解釋: 因爲無重複字符的最長子串是 "abc",所以其長度爲 3。 示例 2:

原创 遊離態GLZ的數字貨幣專欄(一)關於穩定幣

在數字貨幣交易市場中,比特幣(BTC)和其他主流幣(ETH、EOS)因爲較劇烈的波動,能夠給投資人帶來較大的投資回報而被廣泛關注。同時,以USDT、USDK爲首的穩定幣卻能夠保證幣價在長期保持穩定的價格。那麼今天,我們就來談一談關

原创 金融量化python應用基礎篇(1)--numpy的使用

numpy是高性能科學計算和數據分析的基礎包,其主要操作對象爲ndarray(一個快速,靈活的大數據容器) 創建ndarray import numpy as np #創建一維 data1 = [1,2,3,4] arr1 = n

原创 遊離態GLZ的股票量化實驗(一)—— 基於神奇公式思想投資策略

量化斷更了兩年了,重新開寫,希望各路大佬多批評指教。 最近上量化課學習了神奇公式,神奇公式是格林布拉特在其《股市穩贏》中提到的一種選股策略,其本人也依靠這個公式獲得了長期年華40%的收益,賺的盆滿鉢滿。 這個公式的思想簡單來說就兩

原创 爲什麼機器學習(四)—— 樸素貝葉斯的“訓練”爲什麼這麼輕鬆

續着上一篇說到的Iris數據集多分類問題,基於softmax的邏輯迴歸分類需要通過數據訓練一輪輪地降低損失函數,以獲得最佳的參數w和b。 而對於樸素貝葉斯算法來說,其核心源於貝葉斯公式,這個偉大的業餘(?)數學家貝葉斯的著名公式:

原创 爲什麼機器學習(八)——來一發隨機森林

隨機森林是一種典型的集成學習算法。顧名思義,森林是很多棵樹構成的,隨機森林是多棵決策樹構成的。類似治病會診,會診時會有很多醫生每人給一個意見,最終投票選出最多人認可的意見。隨機森林則是由每個決策樹給出一個意見,最終投票最多的意見作

原创 爲什麼機器學習(七)——一起快樂手推SVM

手寫代碼實現: import time import numpy as np import math import random def loadDataSet(filename): dataArr = []

原创 爲什麼機器學習(五) —— 數據降維PCA原理

因此,PCA的過程如下: (1)白化:求樣本的均值向量,所有向量減去均值向量 (2)計算數據集的協方差矩陣 (3)求解特徵值和特徵向量 (4)按特徵值大小排序,選取前k名的特徵向量(k爲降成的維度),以這些向量爲行,構造投影矩陣

原创 爲什麼機器學習(六) —— 數據降維LDA線性判別分析原理

因此,LDA降維的套路是: (1)求各個類的均值向量和總的均值向量 (2)求類間散佈矩陣SBS_BSB​和類內散佈矩陣SwS_wSw​ (3)計算矩陣乘法S=Sw−1SBS = S_w^{-1}S_BS=Sw−1​SB​ (4

原创 大白話講解如何從0開始構築一個知識圖譜+領域問答機器人

從本科畢業設計開始就一直做知識圖譜方面的應用,回想起剛開始做的時候連一些概念性的博客都很難找到,想結合學到現在的經驗做一個知識圖譜入門的介紹和簡單實戰,有興趣或者有需求入門知識圖譜的同學們歡迎和我一起討論交流,也希望各路大佬在知識

原创 遊離態GLZ的股票量化實驗(二)—— 雙均線策略

上次的量化實驗我使用了基於神奇公式的思想進行選股,然後機械化地拿住一年左右賣出,獲得了不錯的回測收益。 選取好的股票顯然可以給我們帶來好的收益,但大家都知道,股票總是有漲有跌,再好的股票也會有強勢的時候和弱勢的時候。如果在弱勢的時

原创 凱利公式的原理推導和應用方向

凱利公式說明的是當我們參加一項有輸有贏,但是收益的數學期望大於0的項目時,我們每次應當投入多少比例的本金能保證我們的收益最大化。 舉個栗子,比方我們買比賽的輸贏,每一場都是64開(別問怎麼知道的,問就是內幕),猜對了贏得一倍的投入

原创 二叉樹刷題筆記(1)——LeetCode105

最近刷題的時候發現很多搜索啊、動態規劃啊,本質上都可以用樹來理解,其中遞歸的思想在做題的時候也讓人受益良多。本着複習一下樹結構和精進遞歸思想的目的,最近刷了幾題二叉樹的題。 105. 從前序與中序遍歷序列構造二叉樹 這題保研前練習