@
[1] 信息檢索語言
信息檢索語言是用於描述信息系統中的信息的內容特徵,常見的信息檢索語言包括分類語言和主題語言。就神經網絡架構搜索這個問題來說,最好選擇主題語言,可以通過藉助自然語言,更具有直觀性和概念唯一性。而主題語言分爲關鍵詞語言和純自然語言。
選用關鍵詞語言就要挑選神經網絡架構搜索的關鍵詞,表徵文獻主題內容具有實質意義的詞語,不要將冠詞、介詞、副詞、連詞作爲查詢的關鍵詞。
[2] 信息檢索技術
採用布爾邏輯檢索的方法:
- 使用邏輯運算符將檢索詞、短語、代碼進行邏輯配置
- 指定文獻命中條件和組配次序
- 是構造檢索最基本的匹配模式,最高效的檢索技術。
以神經網絡搜索技術爲例,搜索 CNKI中國知網
數據庫,選擇高級檢索:
挑選關鍵詞 神經網絡架構搜索+NAS+架構搜索
主題中的加號是高級檢索匹配運算符, 規則如下:
高級檢索支持使用運算符*、+、-、''、""、()進行同一檢索項內多個檢索詞的組合運算,檢索框內輸入的內容不得超過120個字符。
輸入運算符*(與)、+(或)、-(非)時,前後要空一個字節,優先級需用英文半角括號確定。
若檢索詞本身含空格或*、+、-、()、/、%、=等特殊符號,進行多詞組合運算時,爲避免歧義,須將檢索詞用英文半角單引號或英文半角雙引號引起來。
檢索結果:
在IEEE中檢索嘗試:
搜索非中國人發表文獻:
發現非中文發表文獻就有5k之多,檢索結果如下:
查找中國發表的相關內容,只有300篇,看來國內在這個領域並沒有處於領先地位。
-
截詞檢索
- 一般用於引文信息的檢索,爲了避免檢索式過長,一般會在信息檢索時使用截詞檢索。
- 一般有
*
和?
: * 代表無限個字符;?代表有限截斷,一個字符
-
字段限制檢索
- 將檢索詞限定到一個或者多個字段中,來檢索這些檢索字段含有的信息,一般都是檢索提名、主題或者全字段。
- 有題名,篇名
- 作者單位
- 摘要
- 關鍵詞
- 主題詞
- 全文
- 作者
- 書名
- DOI: Igital Objects Identifier: 數字化對象標識符,通過DOI可以獲取該文獻對應的元數據、下載鏈接,進而可以獲取文摘信息,全文。
- 出版年
- 問下按類型
- 所有字段
-
聚類檢索
- 自動聚類用戶所需要的相關信息,重點完成用戶的特性查詢,通過幾次迭代查詢,一般能找到目標的結果。
- 比如:主題、發表年度、文獻來源、機構、基金、文獻類型
[3] 信息檢索工具
網絡數據庫和搜索引擎是最主要的檢索工具,國際三大科技文獻檢索系統:
- 科學引文索引 Science Citation Index SCI
- 工程索引 Engineering Index EI
- 科技會議索引CPCI-S Conference Proceedings Citation Index-Science
一般去Web of Science查詢文獻
[4] 信息檢索流程
4.1 分析問題
神經網絡架構搜索是近些年興起的領域,屬於計算機科學領域的研究,時間設定可以是2012年-2021年,因爲2012年是神經網絡興起的年代,再往前的文獻參考價值不大。目前國內外都有研究,國外以谷歌、微軟等巨頭研究領先,國內也有百度、華爲等公司在開展相關業務,所以語種設置可以不限,一般是英文或者中文。
4.2 選擇檢索工具
這裏選擇web of science作爲檢索工具
4.3 擬定檢索詞
Neural Architecture Search
NAS
4.4. 編寫檢索式
TS=(Neural Architecture Search OR NAS)
4.5 獲取原文或者文獻線索
這樣會存在問題,如果是多個詞,需要用冒號包起來,結果如下: