原创 1009 知識圖譜

分詞、詞性、實體識別 自動摘要/改寫  ——隱變量選擇,不同風格的選擇 翻譯 情感/風險 推薦(用戶行爲理解) 搜索系統(智能搜索 標籤 用戶行爲軌跡)    

原创 DL4J初步在idea中實現(“hello word!”)

  系統要求: Java (開發者版7或更新版本(僅支持64位版本) Apache Maven:Maven是針對Java項目的依賴管理和自動化構建工具。它與IntelliJ等IDE兼容性良好,可以讓您輕鬆安裝DL4J項目庫。 Intell

原创 phoenix+hbase 培訓

毫秒級響應(爲什麼能做到)? 二級索引   Phoenix的相關寫法 update values =sql裏面的insert。。。。優點,可以實現實時更新數據 保證插入數據不重複(去重) 有列族 rowkey對應pk   主鍵一級索引 利

原创 【轉載】spark和Hadoop的區別

文章來源:https://www.cnblogs.com/adnb34g/p/9233906.html 在學習hadoop的時候查詢一些資料的時候經常會看到有比較hadoop和spark的,對於初學者來說難免會有點搞不清楚這二者到底有什麼

原创 hive 部分踩過的坑

1.hive索引 https://www.cnblogs.com/zlslch/p/6105294.html 分區數據非常龐大的情況下,索引常常是優於分區的。 Hive並不像事物數據庫那樣針對個別的行來執行查詢、更新、刪除等操作。這些

原创 搞清楚大數據的幾個概念

首先搞清楚幾個概念 Hadoop:Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS爲海量的數據提供了存儲,而MapReduce則爲海量的數據提供了

原创 mac狀態下anaconda新建環境,刪除環境

anaconda新建和刪除環境服務於一些小衆python包,因爲有些包內置比較複雜,容易發生衝突。 新建: conda create --override-channels -c conda-forge -n XX python=3 O

原创 mac終端更改環境變量/增加路徑

1.打開終端2.輸入sudo vi ~/.bash_profile   回車3.輸入密碼4.按i進入編輯狀態5.增加路徑名稱 如:#mysql  export PATH=$PATH:/usr/local/mysql/bin  6.按esc