原创 Spark:使用jieba分詞的工程搭建

1、IDEA開發環境中project structure的設置 配置項目的JDK: File > Project Structure > Project Settings > Project > Project SDK 在複選框中選擇項

原创 requests+百度翻譯api

百度api使用文檔:http://api.fanyi.baidu.com/api/trans/product/apidoc#languageList 進行開發者認證後進行api使用,我使用requests模塊請求這個api: 如下是官方文

原创 Scala:編程初學實例--對某個目錄下所有文件中的單詞進行詞頻統計

 爲加強對函數式編程的理解,同時鞏固Scala語法,這裏分析一個實例:對某個目錄下所有文件中的單詞進行詞頻統計。 【源碼】 import java.io.File import scala.io.Source import collec

原创 mousewheel鼠標滾輪事件響應及實例

mousewheel鼠標滾輪事件響應 兼容性: 除了FireFox瀏覽器的滾輪事件響應使用的是DOMMouseScroll以外,其餘瀏覽器均使用的是onmousewheel(在使用addEventListener()添加監聽事件的時候就把

原创 Ubuntu修改grub.cfg文件後進不去Ubuntu系統了,開機進入grub2界面

問題 首先,本人作死,在沒有充分了解/boot/grub.grub.cfg文件的情況下,修改了其“menuentry”項,導致再次開機時無法進入Ubuntu,而是進入grub2的命令行。 解決辦法 搞了一下午加一晚上,最終被一篇博客(ht

原创 遞歸與遞推:一隻小蜜蜂

有一隻經過訓練的蜜蜂只能爬向右側相鄰的蜂房,不能反向爬行。請編程計算蜜蜂從蜂房a爬到蜂房b的可能路線數。  其中,蜂房的結構如下所示。  Input 輸入數據的第一行是一個整數N,表示測試實例的個數,然後是N 行數據,每行包含兩個整數a和

原创 Ubuntu Intelligent Pinyin中文輸入法失效以及無法輸入後選詞

不知從何時起我的Intelligent Pinyin中文輸入法除了首選詞,只要選侯選詞就會變成數字, 後來直接我的中文輸入法不能使用了。 【解決辦法】 直接刪除~/.cache/ibus/libpinyin 這個文件夾。 rm -r ~

原创 遞歸與遞推:鑰匙計數之一

B - 鑰匙計數之一  HDU - 1438  一把鎖匙有N個槽,槽深爲1,2,3,4。每鎖匙至少有3個不同的深度且至少有1對相連的槽其深度之差爲3。求這樣的鎖匙的總數。 Input 本題無輸入 Output 對N>=2且N<=31,輸出

原创 Spark:基於jieba分詞的特徵向量提取

基於jieba分詞的對計算機課程名的特徵向量提取 首先引入包: import org.apache.spark.sql.{DataFrame, SparkSession}//spark入口,DataFrame操作需要用到的包 impor

原创 Spark:根據TFIDF提取的特徵向量計算相似度矩陣(皮爾遜係數、斯皮爾曼係數)

特徵向量的提取請看我的之前的一篇博客: https://blog.csdn.net/LOG_IN_ME/article/details/103047796 特徵向量提取結果如下圖: 這個DataFrame的“TF-IDF”列就是提取的特

原创 Spring:model和session的區別

【通俗】 其實model和session都是存放信息的地方,不同的地方就是他們的生命週期不同,model是request級別的,session是一次會話,在服務器與一個用戶客戶端交互過程中一直保留。 即在用戶登錄一個網站後,session

原创 串:KMP算法

  //KMP算法(包括改進KMP算法) #define MAXLEN 25 #include<stdio.h> #include<string.h> typedef struct{ char ch[MAXLEN];//ch[0]不用

原创 樸素(簡單)模式匹配

子串的定位操作通常稱爲串的模式匹配,它求的是子串(模式串)在主串中的位置。 【算法思想】從主串S的第一個字符起,與模式串T的第一個字符開始比較, 若相等,則繼續逐個匹配後續字符; 若不相等,則主串指針回退,從下一個字符起與模式串重新比較;

原创 操作受限的線性表:鏈隊列

隊列的鏈式表示叫作鏈隊列 和棧的鏈式存儲一樣,都是單鏈表的閹割版 以下實現的是帶頭結點的鏈隊列  (成員變量有結構體的結構體在訪問成員時用->,其餘用.) //隊列的鏈式表示叫作鏈隊列 //和棧的鏈式存儲一樣,都是單鏈表的閹割版 //以