1.簡介
CiteSpace 又翻譯爲“引文空間”,是一款着眼於分析科學分析中蘊含的潛在知識,是在科學計量學、數據可視化背景下逐漸發展起來的引文可視化分析軟件。由於是通過可視化的手段來呈現科學知識的結構、規律和分佈情況,因此也將通過此類方法分析得到的可視化圖形稱爲“科學知識圖譜”。摘自 李傑.CiteSpace中文版指男
2.如何用Citesapce挖掘現有數據,首先對於一些名詞進行解釋。
①共被引分析
在做學術研究時,我們勢必會研究前人在此領域所做的工作,也會引用他人的研究成果。但一開始不同人對於某一新的領域的探究是獨立的,發表出來的研究論文處於遊離狀態。然而隨着對該領域研究的的不段深入,人們在做研究時往往會引證前人的文獻,每次引用就像扯了一條線,慢慢的越來越多的人引用他人的論文,就會以論文爲節點,每次的引用作爲線,形成一個引文網絡。
共被引分析就誕生在這個引文網絡上面,當兩篇甚至多篇文獻同時出現在第三篇引用文獻的參考文獻目錄中,則這些被引用的論文就形成了共被引關係。像這種滿足條件的第三篇論文的個數,就代表了共被引的次數。共被引次數越多,說明這些論文的相似度越大,關聯強度也越大。
②共詞分析
詞頻分析:在文獻信息中提取能夠表達論文核心內容的關鍵詞和主題詞頻高低分佈,來研究該領域發展動向和研究熱點的方法。
共詞分析則是在詞頻分析的基礎上,對詞頻網絡進行更高層次的分析,原理是對一組詞兩兩統計他們在一組文獻中出現的次數,以此來測度他們之間的親疏關係。
③突現分析
Citespace提供burst detection的功能來探測在某一段時間引用量有較大的變化的情況。用於發現某一個主題詞、關鍵詞衰落或興起的情況。
④聚類分析
指將物理或抽象對象的幾何分組爲由類似的對象組成的多個類的分析過程,以分析對象的相似性爲基礎。
⑤操作界面的其他功能
以上內容參考博客:https://www.jianshu.com/p/c3139ee1cf1f
欲詳細瞭解可移步上述博客。
3.練手案例
區塊鏈的總體分析:知網的8345篇生成的區塊鏈的總體趨勢圖
根據文獻發表數量的年度分佈趨勢,可以將其分爲三個階段,萌芽階段、發展探索階段、快速發展階段、可以看出區塊鏈技術的萌芽萌發於2013---2015年間,在2015到2017年間進入發展階段,到 2017--2018年間快速發展,但2018--2019至今區塊鏈發展趨於平緩。
主題分佈圖
將2015---2019年間核心期刊論文作爲數據,進行可視化分析。
(1)首先建立四個空文件夾:
(2)將知網2015--2019關於區塊鏈的文獻導入到input文件夾(不同數據庫導出文獻的格式要求同,知網要求如下)
(3)僅可導入2015-2019年的5980篇論文數據
(4)
知網數據庫裏面的數據進行格式轉換時用選擇CNKI
將轉換完成的output數據copy到data文件夾,如下圖output中的數據。
(5)建立一個項目
(5)
4.分析圖像(從圖上可以獲得的信息,暫不贅述)
核心作者分析:
核心機構分析圖:
術語、關鍵字的時間線圖
關鍵詞、術語出現超過50次以上的