原创 關於TCP擁塞控制的一點想法

今天又想到去年在華爲iaccess系統上遇到的問題,由於連續丟且沒有dup ack引起的TCP擁塞控制的性能問題,這個問題當時給的調參數的方案雖然緩解了問題,但不能從根本上解決此類問題,今天中午休息的時候靜下心來好好想了想,把不成熟的思路

原创 京東手機評論情感分析

新詞識別出的新詞礎上,通過Naive Bayes方法對京東評論中的好評和差進行分析,得詞典中詞(新詞+結巴詞典)到詞的情感評分。因爲語料庫的侷限,結巴詞典中的詞的極性同時參考了BosonNLp情感詞典。情感詞典已上傳到CSDN: http

原创 京東手機評論新詞識別

目標: 把jieba分詞開源的詞典作爲基礎詞典,從東上的手機評論中,找出新詞。 先從京東上把評論抓下來。京東只讓看到每個商品的前1000條評論,經過清洗、大小寫轉換、簡繁體轉換、排重後共100M數據。 統計高頻詞,採集特徵。特徵包括自由度

原创 京東手機高質量評論挖掘

通過語義分析(用哈工大的LTP做依存分析)來提取關鍵詞,結合情感詞典,把評論中比較有信息量的內容提取出來,並分類。用哈工大LTP做分詞和依存分析,用gensim的wordvect工具向量化,參考jieba的idf詞典。目前還在迭代、優化中