原创 mac brew 安裝的mysql 啓動與停止

mysql.server startmysql.server stop

原创 MAC apache 將DocuemntRoot 設置爲 用戶目錄中 permission 403 問題

例如將DocumentRoot設置爲 /Users/xxx/Documents/project/myweb其實很簡單,就是 執行 apache的 www用戶沒有Documents的讀和執行權限,設置一下就解決問題了chmod 755 D

原创 中文分詞算法 mmseg python版本

mmseg算法是對最大匹配算法的擴展。簡單來說,mmseg每次匹配時,總會多向後匹配兩個單詞,然後選擇這個三個單詞的總體匹配最優的。 mmseg  主要做了以下幾方面的擴展: 假設對字符串C1C2...Cn進行分割  匹配時,從小到大

原创 matplotlib show() 立即返回,無效,no module named _backend_gdk

具體什麼原因我也不是很清楚,但是可以使用如下方法解決,即在文件頭部加兩行 import matplotlibmatploblit.use('WXAgg')  或者,修改matplotlib的配置文件,一般位於/usr/local/lib

原创 平均不等式

下面四個式子分別是  調和平均數 幾何平均數 算術平均數 平方平均數 且呈現遞增關係

原创 linux(ubuntu) php : call to undefined function mysql_connect

可以使用phpinfo()查看mysql模塊有沒有被加載,如果沒有的話,那麼可能需要安裝 php5-mysql一般安裝好之後,就可以解決問題了

原创 mysql:使用已有的記錄更新另一條數據

create table test(    id integer primary key,   name varchar(100));例如現在在test表中有N條數據,其中有兩條爲12, 'hello'13, 'world'如果想把上一

原创 linux 下文本文件的編碼格式轉換

主要工具enca,沒有的話需要安裝enca -L zh_CN filename 可以查看文件的編碼格式,如果需要轉換的話,則enca -L zh_CN -x utf-8 filename 或 utf-8是目標編碼格式,這個命令會覆蓋原來

原创 hadoop 配置中的坑

1. core-site.xml 中,有一個屬性是 fs.default.name,而不是 dfs.default.name 2. hdfs-site.xml 中,配置dfs.name.dir 和 dfs.data.dir時,如果有

原创 MySQL 配置主從備份

爲了數據安全,一般都會將數據庫中的數據進行備份。MySQL自帶的主從備份,使用起來非常方便,而且功能強大,能夠提供近似同步的性能。配置主從備份時,只需要讓slave知道master的地址和端口,以及一個有備份REPLICATION SL

原创 最簡單的中文分詞(最大匹配以及反向最大匹配)

點贊 收藏 分享 文章舉報 mlnotes 發佈了223 篇原創文章 · 獲贊 19 · 訪問量 27萬+ 私信

原创 jar 打包java class文件後,運行jar 出現 Failed to load Main-Class manifest attribute from 錯誤

出現該錯誤的原因在於沒有指定main class,假設所有要打包的class文件都在classes文件夾中,解決方案如下新建一個 myManifest 文件,裏面的內容很簡單 Main-Class: xxx.xx.xxx或者: echo

原创 刪除數據庫中的重複記錄(僅刪除重複的)

背景:今天在用crawler爬數據的時候,第一次爬的時候被我意外中止了,後來又重新開始,但卻忘了清除一些垃圾數據,導致在wordlocation 表中產生了不少重複的記錄。wordlocation 表的定義如下 wordlocation

原创 vim 查找字符串出現的次數

在所有行中查找 字符串 出現的次數 :%s/字符串/&/gn 在m和n行之間查找 字符串 出現的次數:m,ns/字符串/&/gn     點贊 收藏 分享 文章舉報 mlno

原创 隨機優化算法

對於解可以用向量或者矩陣表示的問題,可以採用隨機優化的算法來求近似最優解。前提:1)解是向量或者矩陣2)最優解與其他次優解臨近算法:隨機優化,爬山法,模擬退火,遺傳隨機算法:完全隨機爬山法:找到的可能是局部最優解模擬退火:按概率接受更差