原创 【機器學習】常用算法PK

KNN算法 一、KNN算法的優點   1、KNN是一種在線技術,新數據可以直接加入數據集而不必進行重新訓練 2、KNN理論簡單,容易實現 二、KNN算法的缺點 1、對於樣本容量大的數據集計算量比較大。 2、樣本不平衡時,預

原创 【構建知識圖譜neo4j】

neo4j download下載Neo4j。然後通過http://localhost:7474訪問 1、創建實體文件csv,需要包含唯一id(採用uuid1的方式) 2、創建關係csv,通過實體ID相連接; 導入: 實體1: LOAD

原创 【tf系列2】參數說明

參考文章:http://blog.csdn.net/u014595019/article/details/52759104 init_scale = 0.1 # 相關參數的初始值爲隨機均勻分佈,範圍是[-init_scale,+init

原创 LSTM 實例

環境:python3.5,tensorflow1.1 代碼如下: import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #

原创 【keras總結】

     Keras是由純python編寫的基於theano/tensorflow的深度學習框架。          Keras是一個高層神經網絡API,支持快速實驗,能夠把你的idea迅速轉換爲結果,如果有如下需求,可以優先選擇Kera

原创 SVM:如何判斷線性可分

支持向量機(SVM),介紹都說了假設數據要是線性可分。 如果數據不是線性可分的,我們就必須要採用一些特殊的方法,比如SVM的核技巧把數據轉換到更高的維度上,在那個高維空間數據更可能是線性可分的(Cover定理)。 現在的問題是,

原创 【python爬蟲】抓取炒股概念

非常感謝https://www.cnblogs.com/xin-xin/p/4297852.html。該系列講解很詳細。 另附上我寫的抓取炒股概念代碼。 採用火狐瀏覽器,F12,選取Network,解析一下傳送的地址。 import

原创 【tf系列1】常用函數說明

發現有個寫的比較好的博客,方便以後可以查閱,也沒必要重新粘一次了,留個鏈接作爲入口。 初識tf:http://blog.csdn.net/u014595019/article/details/52677412 tensorFlow常用函數

原创 智能糾錯【優化版】

import jieba from pypinyin import pinyin, lazy_pinyin from common.basicInfo import BasicInfo """糾錯模塊""" class ErrorR

原创 基於TextRank API寫的測試

import pickle from textrank4zh import TextRank4Keyword, TextRank4Sentence

原创 【百度語音rest API】文本轉換成語音,以及語音轉化成文本

通過rest API,調用百度語音接口,將其接入智能客服。 百度語音:http://ai.baidu.com/docs/#/ASR-API/top #!/usr/bin/python3 import urllib.request im

原创 python csv寫入多列

import csv import os def main(): current_dir = os.path.abspath('.') file_name = os.path.join(current_dir, "cs

原创 【word2vec實例1】

# coding = utf8 import wordcut import create_dict import vectorize import classify import pickle import psutil import

原创 【word2vec實例2】加載模型

current_dir = os.path.abspath('.') w2v_file = os.path.join(current_dir, 'w2v_file_sg') self.dic = gensim.models.Word2Ve