原创 用戶畫像--總覽

 根據不同公司業務需求的不同數據架構也不同,下面只是舉一個例子。              

原创 oracle語法整理

級聯查詢: select * from TA_ZX start with 諮詢id = '96AF999021E2E9F3E050007F010099A2' connect by prior pid=fid order by 諮詢

原创 使用neo4j-admin導入csv文件

  導入csv文件的最大麻煩還是csv文件格式問題,以及數據問題。 1、首先將準備好的csv文件用筆記本打開,格式另存爲utf-8形式 財務負責人表: 公司表: 財務負責人表與公司表關係: 導入前要將已有的默認數據庫刪掉,也就是配

原创 關於知識圖譜的應用方向

如何利用大數據風控體系應對多渠道風險。 1、合合信息失聯客戶管理知識圖譜 部分借款人在借款成功後出現不還款現象並且“失聯”,使得催收人員因無法聯繫借款人本人,無從下手。藉助知識圖譜,挖掘出更多的與借款人有關係的新聯繫人,大大提高催收成功

原创 LW-基於知識圖譜的專利推薦系統設計與實現(分類號:TP311 單位代碼:10422)觀後總結

  論文的主要工作以基於知識圖譜的專利推薦爲主題,從研究背景和意義、國內外研究現狀、用戶需求分析、系統概要設計、核心算法設計、系統詳細設計以及系統實現與測試等幾個方面對基於知識圖譜的專利推薦系統進行詳細描述。   第1章 緒論 1.1 背

原创 neo4j--Cypher查詢調優與執行計劃

1.查詢調優 1.1查詢如何執行 Cypher執行引擎會將每個Cypher查詢都轉爲一個執行計劃。在執行查詢時,執行計劃將告知Neo4j執行什麼樣的操作。 1.2查詢性能分析 查看執行計劃對查詢進行分析時有兩個Cypher語句可用: 1.

原创 人工智能-統計機器學習- 自適應提升算法

監督學習--Boosting (adaptive boosting, 自適應提升): 對於一個複雜的分類任務,可以將其分解爲 若干子任務,然後將若干子任務完成方法綜合,最終完成該複雜任務。我們將這若干子任務稱爲弱分類器(weak clas

原创 人工智能-統計機器學習-特徵人臉方法(Eigenface)

人臉識別之特徵人臉方法是一種應用主成份分析來實現人臉圖像降維的方法,其本質是用一種稱爲“特徵人臉(eigenface)”的特徵向量按照線性組合形式來表達每一張原始人臉圖像,進而實現人臉識別。 由此可見,這一方法的關鍵之處在於如何得到特徵人

原创 neo4j--Cypher語法練習(LOAD CSV)

1.21 LOAD CSV      LOAD CSV用於從CSV文件中導入數據。 CSV文件的URL可以由FROM後面緊跟的任意表達式來指定。 需要使用AS來爲CSV數據指定一個變量 LOAD CSV支持以gzip,Deflate和ZI

原创 neo4j--Cypher語法練習(START、CREATE、MERGE)

1.5 START 通過遺留索引(legacy index)查找開始點。START語句應當僅用於訪問遺留的索引。所有其他的情況,都應使用MATCH代替,從Cyper3.2開始START語句已經被廢棄。 (1)通過索引獲取節點      當

原创 數據清洗---數據整合

數據整合可以使用Pandas庫中merge()函數合併數據集 import pandas as pd #建兩個數據集 df1=DataFrame({'lkey':['b','b','a','c'],'data1':range(4)})

原创 知識圖譜--概覽

KG的本質 1)Web視角 像建立文本之間的超鏈接一樣,建立數據之間的語義鏈接 2)NLP視角 從文本中抽取語義和結構化數據 3)KR視角 利用計算機符號表示和處理知識 4)AI視角 利用知識庫輔助理解人的語言 5)DB視角/ Datab

原创 LW-基於知識圖譜的醫療病例數據存儲研究(計算機工程,1000-3428(2019)01-0009-08 觀後總結)

這篇論文提出一種改進的病例圖譜存儲方案,即多元關係到RDF三元組的轉化方案。基於原始病例數據具有空值多、謂詞數量多且爲此不固定等特徵,採用基於改進三元組表的存儲方案,將病例RDF三元組的實體和屬性進行ID化。在此基礎上,設計實體類型表,面

原创 人工智能-統計機器學習-主成份分析

主成份分析: Principle Component Analysis (PCA) 主成份分析是一種特徵降維方法,降維後的結果要保持原始數據固有結構。 原始數據結構:  圖像數據中結構:視覺對象區域構成的空間分佈  文本數據中結構:單詞之

原创 人工智能-統計機器學習- K均值聚類 (K-means 聚類)

K均值聚類 (K-means 聚類)是無監督學習的一種算法,無監督學習的重要因素有: 數據特徵( 圖像中顏色、紋理或形狀等特徵、 聽覺信息中旋律和音高等特徵 、文本中單詞出現頻率等特徵) 相似度函數 (定義一個相似度計算函數,基於所提取的