原创 R語言對微博內容的根據人物分類以及對博文的分詞統計

首先介紹一下數據源,根據爬蟲獲得的微博數據,當然包括很多字段(如人物暱稱,發表時間,發表內容,是否原創,是否轉發等等),在這裏簡要介紹一下處理思路,我們只需要這裏的人物暱稱,和發表內容,發表內容用於分詞分析自然不用多說,人物暱稱是

原创 PHP模擬登陸

PHP模擬登陸抓取,不使用cookieJar文件保存cookie,第一次嘗試寫面向對象Mark,自己留着看。其中的幾個難點,password的加密方法,cookie的接連獲取,巧用substr()和strpos取值。 <?php

原创 C# MFC項目實錄

1、MainWindow.xaml.cs,繼承從windows改成NavigationWindom; 2、MainWindow 改爲Navigation 目的把mainwindow改成導航,與page配合使用 3、MainWind

原创 ubuntu搭建記錄

ubuntu系統是16.04,有一個特點是apt庫沒有php5的只有php7的, 所以如果要安裝php5的 就需要額外操作了 sudo add-apt-repository ppa:ondrej/php sudo apt-get upd

原创 php遇到的有用的函數

header(‘location:’) chdir()改變目錄 basename(FILE)當前文件名稱 strpos strrpos stripos strripos substr() empty isset realp

原创 Apriori關聯算法

樣本數據 a,c,e b,d b,c a,b,c,d a,b b,c a,b a,b,c,e a,b,c a,c,e setwd("/users/XXX/desktop/R/chapter5/示例程序") #Matri

原创 django建站實錄

pip install django django-admin startproject name cd name python manage.py runserver python manage.py startapp poll

原创 mysql 涉及到的優化

select min(id) from table_name where ; 優化後: select id from table_name use index(primary) where …;

原创 scrapy cluster搭建實錄

一、環境依賴 python2.7 redis kafka(zookeeper) scrapy cluster 二、預備工作 我的操作系統爲Ubuntu sudo ufw disable #關閉防火牆 sudo

原创 Python學習二------文件處理篇

預備工作 import os os.chdir(r”c:….”)更改工作目錄 os.getcwd() 獲取當前工作目錄 文件處理 讀取mode=’r’ f=open(filename,mode) a=f.readlines

原创 R最小二乘法,曲線擬合基礎

首先簡要介紹一下最小二乘法 在我們研究兩個變量(x,y)之間的相互關係時,通常可以得到一系列成對的數據(x1,y1.x2,y2… xm,ym);將這些數據描繪在x -y直角座標系中,若發現這些點在一條直線附近,可以令這條直線方程如y=a

原创 BP神經網絡預測

setwd("/users/xuwei/desktop/R/chapter5/示例程序") myData<-read.csv("sales_data.csv",header=F)[,2:5] head(myData) library(nn

原创 python代碼優化

優化一: 原代碼 num =range(10) size = len(num) events = [] i =0 while i<size: if i%2==0: events.append(i) i

原创 nginx.conf設置了什麼

user worker_processes 1;//一般等於cpu數量 全局錯誤日誌及PID文件 error_log /var/log/nginx/error.log; pid /var/run/nginx.pid;

原创 YII2 ActiveFORM原生表單沒有日期輸入框

雖然非常喜歡YII2快速開發,但是原生表單Active form的不可控,讓我很不喜歡,也許有可控的方法,比如activeform提供input類型就很有限,沒有這種日期框 這裏引入github上的Yii2-date-picker插件