原创 1009 知識圖譜
分詞、詞性、實體識別 自動摘要/改寫 ——隱變量選擇,不同風格的選擇 翻譯 情感/風險 推薦(用戶行爲理解) 搜索系統(智能搜索 標籤 用戶行爲軌跡)
原创 DL4J初步在idea中實現(“hello word!”)
系統要求: Java (開發者版7或更新版本(僅支持64位版本) Apache Maven:Maven是針對Java項目的依賴管理和自動化構建工具。它與IntelliJ等IDE兼容性良好,可以讓您輕鬆安裝DL4J項目庫。 Intell
原创 phoenix+hbase 培訓
毫秒級響應(爲什麼能做到)? 二級索引 Phoenix的相關寫法 update values =sql裏面的insert。。。。優點,可以實現實時更新數據 保證插入數據不重複(去重) 有列族 rowkey對應pk 主鍵一級索引 利
原创 【轉載】spark和Hadoop的區別
文章來源:https://www.cnblogs.com/adnb34g/p/9233906.html 在學習hadoop的時候查詢一些資料的時候經常會看到有比較hadoop和spark的,對於初學者來說難免會有點搞不清楚這二者到底有什麼
原创 hive 部分踩過的坑
1.hive索引 https://www.cnblogs.com/zlslch/p/6105294.html 分區數據非常龐大的情況下,索引常常是優於分區的。 Hive並不像事物數據庫那樣針對個別的行來執行查詢、更新、刪除等操作。這些
原创 搞清楚大數據的幾個概念
首先搞清楚幾個概念 Hadoop:Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS爲海量的數據提供了存儲,而MapReduce則爲海量的數據提供了
原创 mac狀態下anaconda新建環境,刪除環境
anaconda新建和刪除環境服務於一些小衆python包,因爲有些包內置比較複雜,容易發生衝突。 新建: conda create --override-channels -c conda-forge -n XX python=3 O
原创 mac終端更改環境變量/增加路徑
1.打開終端2.輸入sudo vi ~/.bash_profile 回車3.輸入密碼4.按i進入編輯狀態5.增加路徑名稱 如:#mysql export PATH=$PATH:/usr/local/mysql/bin 6.按esc