jQuery 源碼分析選擇器

聲明：本文爲原創文章，如需轉載，請註明來源並保留原文鏈接Aaron，謝謝！

 打開jQuery源碼，一眼看去到處都充斥着正則表達式，jQuery框架的基礎就是查詢了，查詢文檔元素對象，所以狹隘的說呢，jQuery就是一個選擇器，並這個基礎上構建和運行查詢過濾器！

工欲善其事，必先利其器，所以先從正則入手

我們來分解一個表達式

// A simple way to check for HTML strings
// Prioritize #id over <tag> to avoid XSS via location.hash (#9521)
// Strict HTML recognition (#11290: must start with <)
     rquickExpr = /^(?:\s*(<[\w\W]+>)[^>]*|#([\w-]*))$/,

作者的解釋呢很簡單，一個簡單的檢測HTML字符串的表達式

分解：

通過選擇|分割二義,匹配^開頭或者$結尾

    ^(?:\s*(<[\w\W]+>)[^>]*
    #([\w-]*))$

2. ^(?:\s*(<[\w\W]+>)[^>]*

(?:pattern) : 匹配 pattern 但不獲取匹配結果，也就是說這是一個非獲取匹配，不進行存儲供以後使用
\s* : 匹配任何空白字符，包括空格、製表符、換頁符等等 零次或多次 等價於{0,}
(pattern) : 匹配pattern 並獲取這一匹配。所獲取的匹配可以從產生的 Matches 集合得到，使用 $0…$9 屬性
[\w\W]+ : 匹配於'[A-Za-z0-9_]'或[^A-Za-z0-9_]' 一次或多次， 等價{1,}
(<[wW]+>) :這個表示字符串裏要包含用<>包含的字符，例如<p>,<div>等等都是符合要求的
[^>]* : 負值字符集合,字符串尾部是除了>的任意字符或者沒有字符,零次或多次等價於{0,},

([\w-]*))$

匹配結尾帶上#號的任意字符，包括下劃線與-
還要穿插一下exec方法

如果執行exec方法的正則表達式沒有分組（沒有括號括起來的內容），那麼如果有匹配，他將返回一個只有一個元素的數組，這個數組唯一的元素就是該正則表達式匹配的第一個串;如果沒有匹配則返回null。
exec如果找到了匹配，而且包含分組的話，返回的數組將包含多個元素，第一個元素是找到的匹配，之後的元素依次爲該匹配中的第一、第二…個分組（反向引用）

所以綜合起來呢大概的意思就是：匹配HTML標記和ID表達式（<前面可以匹配任何空白字符，包括空格、製表符、換頁符等等）

簡單測試下：

var str = ' <div id=top></div>';
var match = rquickExpr.exec(str);
console.log(match)
//[" <div id=top></div>", "<div id=top></div>", undefined, index: 0, input: " <div id=top></div>"]

var str = '[?\f\n\r\t\v]<div id=top></div>'; 

var str = '#test';
var match = rquickExpr.exec(str);
console.log(match)
//["#test", undefined, "test", index: 0, input: "#test"]

jQuery選擇器接口

API

image

jQuery是總入口，選擇器支持9種方式的處理

1.$(document)   
2.$(‘<div>’) 
3.$(‘div’) 
4.$(‘#test’) 
5.$(function(){}) 
6.$("input:radio", document.forms[0]); 
7.$(‘input’, $(‘div’)) 
8.$() 
9.$("<div>", { 
         "class": "test", 
         text: "Click me!", 
         click: function(){ $(this).toggleClass("test"); } 
      }).appendTo("body"); 
10$($(‘.test’))

jQuery這個選擇器重構了幾次後，現在邏輯結構相當的清晰了，一看大概就知道

不能不得說jQuery的反模式，非職責單一深受開發者喜歡，一個接口承載的職責越多內部處理就越複雜了

jQuery查詢的的對象是dom元素，查詢到目標元素後，如何存儲？

查詢的到結果儲存到jQuery對象內部，由於查詢的dom可能是單一元素，也可能是合集
jQuery內部應該要定義一個合集數組，用於存在選擇後的dom元素，
當然啦，根據API，jQuery構建的不僅僅只是DOM元素，還有HTML字符串,Object,[] 等等…

本質上講jQuery.fn.init構建的出來的對象，就是jQuery對象

init: function( selector, context, rootjQuery ) {
            var match, elem;

            // HANDLE: $(""), $(null), $(undefined), $(false)
            if ( !selector ) {
                return this;
            }

            // Handle HTML strings
            if ( typeof selector === "string" ) {
                // HANDLE: $(DOMElement)
            } else if ( selector.nodeType ) {
                // HANDLE: $(function)
                // Shortcut for document ready
            } else if ( jQuery.isFunction( selector ) ) {
                return rootjQuery.ready( selector );
            }

            if ( selector.selector !== undefined ) {
                this.selector = selector.selector;
                this.context = selector.context;
            }

            return jQuery.makeArray( selector, this );
        },

源碼縮進後的結構：

處理"",null,undefined,false,返回this ，增加程序的健壯性
處理字符串
處理DOMElement,返回修改過後的this,給this添加了
處理$(function(){})

匹配模式一：$(“#id”)

進入字符串處理

if ( typeof selector === "string" ) {

發現不是 “<”開始，”>”結尾 $(‘
My new text
‘)這種的情況
如果selector是html標籤組成的話，直接match = [ null, selector, null ];

而不用正則檢查

if (selector.charAt(0) === "<" && selector.charAt(selector.length - 1) === ">" && selector.length >= 3) {

否則的話需要match = rquickExpr.exec( selector )

match = rquickExpr.exec( selector );

匹配的html或確保沒有上下文指定爲# id

if ( match && (match[1] || !context) ) {

match[1]存在，處理(html)−>(array),,也就是處理的是html方式

if ( match[1] ) {

處理ID

elem = document.getElementById( match[2] );

// Check parentNode to catch when Blackberry 4.6 returns
// nodes that are no longer in the document #6963
if ( elem && elem.parentNode ) {
    // Inject the element directly into the jQuery object
    this.length = 1;
    this[0] = elem;
}

this.context = document;
this.selector = selector;
return this;

至此本次檢索完畢!

可以看到

this就是jQuery工廠化後返回的對象

    this.length    
    this[0] = elem
    this.context = document;
    this.selector = selector;

image

匹配模式二：

重複的地方跳過直接看處理接口

if ( match && (match[1] || !context) ) {
    // HANDLE: $(html) -> $(array)
    if ( match[1] ) {
        context = context instanceof jQuery ? context[0] : context;
        // scripts is true for back-compat
        jQuery.merge( this, jQuery.parseHTML(
            match[1],
            context && context.nodeType ? context.ownerDocument || context : document,
            true
        ) );
        // HANDLE: $(html, props)
        if ( rsingleTag.test( match[1] ) && jQuery.isPlainObject( context ) ) {
            for ( match in context ) {
                // Properties of context are called as methods if possible
                if ( jQuery.isFunction( this[ match ] ) ) {
                    this[ match ]( context[ match ] );
                    // ...and otherwise set as attributes
                } else {
                    this.attr( match, context[ match ] );
                }
            }
        }
        return this;
        // HANDLE: $(#id)
    } else {

傳入上下文：

context && context.nodeType ? context.ownerDocument || context : document

ownerDocument和 documentElement的區別

ownerDocument是Node對象的一個屬性，返回的是某個元素的根節點文檔對象：即document對象
documentElement是Document對象的屬性，返回的是文檔根節點
對於HTML文檔來說，documentElement是<html>標籤對應的Element對象，ownerDocument是document對象

具體請看API手冊

jQuery.merge( first, second ) 合併兩個數組內容到第一個數組。

jQuery.parseHTML

使用原生的DOM元素的創建函數將字符串轉換爲一組DOM元素，然後，可以插入到文檔中。

str = "hello, <b>my name is</b> jQuery.",
html = $.parseHTML( str ),

image

源碼：

parseHTML: function( data, context, keepScripts ) {
    if ( !data || typeof data !== "string" ) {
        return null;
    }
    if ( typeof context === "boolean" ) {
        keepScripts = context;
        context = false;
    }
    context = context || document;
    var parsed = rsingleTag.exec( data ),
        scripts = !keepScripts && [];
    // Single tag
    if ( parsed ) {
        return [ context.createElement( parsed[1] ) ];
    }
    parsed = jQuery.buildFragment( [ data ], context, scripts );
    if ( scripts ) {
        jQuery( scripts ).remove();
    }
    return jQuery.merge( [], parsed.childNodes );
},

匹配一個獨立的標籤

rsingleTag = /^<(\w+)\s*\/?>(?:<\/\1>|)$/,

^<(\w+)\s*\/?>  : 以<開頭，至少跟着一個字符和任意個空白字符，之後出現0或1次/>
(?:<\/\1>|)$        : 可以匹配<、一個/或者空白並以之爲結尾

  這樣如果沒有任何屬性和子節點的字符串（比如'<html></html>'或者'<div></div>'這樣）會通過正則的匹配，當通過正則的匹配後則會通過傳入的上下文直接創建一個節點：

只是單一的標籤：


if ( parsed ) {
        return [ context.createElement( parsed[1] ) ];


 }

而未通過節點的字符串，則通過創建一個div節點，將字符串置入div的innerHTML：

parsed = jQuery.buildFragment( [ data ], context, scripts );

它會把傳入的複雜的html轉爲文檔碎片並且存儲在jQuery.fragments這個對象裏。這裏要提一下，document.createDocumentFragment()是相當好用的，可以減少對dom的操作.

創建一個文檔碎片DocumentFragment

如果要插入多個DOM元素，可以先將這些DOM元素插入一個文檔碎片，然後將文檔碎片插入文檔中，這時插入的不是文檔碎片，而是它的子孫節點；相比於挨個插入DOM元素，使用文檔碎片可以獲得2-3倍的性能提升；
如果將重複的HTML代碼轉換爲DOM元素，可以將轉換後的DOM元素緩存起來，下次（實際是第3次）轉換同樣的HTML代碼時，可以直接緩存的DOM元素克隆返

當一個HTML比一個沒有屬性的簡單標籤複雜的時候，實際上，創建元素的處理是利用了瀏覽器的innerHTML 機制。

1 tmp = tmp || fragment.appendChild( context.createElement("div") );
2 
3 // Deserialize a standard representation
4 tag = ( rtagName.exec( elem ) || ["", ""] )[ 1 ].toLowerCase();
5 wrap = wrapMap[ tag ] || wrapMap._default;
6 tmp.innerHTML = wrap[ 1 ] + elem.replace( rxhtmlTag, "<$1></$2>" ) + wrap[ 2 ];

特別說明，jQuery創建一個新的<div>元素，並且設置innerHTML屬性爲傳入的HTML代碼片段。當參數是一個單標籤，就像 $('<img />') or $('<a></a>')，jQuery將使用javasrcipt原生的 createElement()函數創建這個元素。
當傳入一個複雜的html，一些瀏覽器可能不會產生一個完全複製HTML源代碼所提供的DOM。正如前面提到的，jQuery使用的瀏覽器.innerHTML屬性來解析傳遞的HTML並將其插入到當前文檔中。在此過程中，一些瀏覽器過濾掉某些元素，如<html>, <title>, 或 <head>的元素。其結果是，被插入元素可能不是傳入的原始的字符串。
不過，這些被過濾掉的標籤有限的。有些瀏覽器可能不完全複製所提供的HTML源代碼生成DOM。例如，Internet Explorer的版本8之前轉換所有鏈接的href屬性爲絕對URL路徑，和Internet Explorer第9版之前，不增加一個單獨的兼容層的情況下，將無法正確處理HTML5元素。
爲了確保跨平臺的兼容性，代碼片段必須是良好的。標籤可以包含其他元素，但需要搭配的結束標記

如果第一個參數(HTML字符串)爲一個空的單標籤，且第二個參數context爲一個非空純對象
var jqHTML = $(‘

‘, { class: ‘css-class’, data-name: ‘data-val’ });

console.log(jqHTML.attr[‘class’]); //css-class
console.log(jqHTML.attr[‘data-name’]); //data-val

匹配模式三：$(.className)

如果第一個參數是一個.className，jQuery對象中擁有class名爲className的標籤元素，並增加一個屬性值爲參數字符串、document的selector、context屬性
return jQuery(document).find(className);

匹配模式四：$(.className, context)

如果第一個參數是.className，第二個參數是一個上下文對象(可以是.className(等同於處理$(.className .className))，jQuery對象或dom節點)，
jQuery對象包含第二個參數上下文對象中擁有class名爲className的後代節點元素，並增加一個context和selector屬性

return jQuery(context).find(className);

匹配模式五：$(jQuery對象)

如果第一個參數是jQuery對象，上面已經分析過如果在查詢dom時，參數是一個#加元素id，返回的jQuery對象會增加一個屬性值爲參數字符串、document的selector、context屬性

var jq = $(‘#container’);
console.log(jq.selector); // #container
console.log(jq.context); // document

那麼當出現((‘#container’))該如何處理呢？同樣的，返回的jQuery對象同情況

var jq2 = ( (‘#container’));
console.log(jq2.selector); // #container
console.log(jq2.context); // document

等等………………

jQuery 構造器

 由此可見，從本質上來說，構建的jQuery對象，其實不僅僅只是dom，還有很多附加的元素，用數組的方式存儲，當然各種組合有不一樣，但是存儲的方式是一樣的

總的來說分2大類：

單個DOM元素，如$(ID),直接把DOM元素作數組傳遞給this對象
多個DOM元素，集合形式，可以通過CSS選擇器匹配是有的DOM元素，過濾操作,構建數據結構

CSS選擇器是通過jQuery.find(selector)函數完成的，通過它可以分析選擇器字符串，並在DOM文檔樹中查找符合語法的元素集合

選擇器這章有點亂，東西太多了，不能一一陳列 , 後期在慢慢整理

jQuery 源碼分析選擇器

([\w-]*))$

公司剛入職了一名 Java 中級開發，短短 4 行代碼居然湊齊了 3 個 bug！我哭了~~

Nginx R31 doc-13-Limiting Access to Proxied HTTP Resources 訪問限流

中外程序員到底有啥區別？

Python數據分析與挖掘實戰（5章）

python包：pandas

C++文件/流

一、什麼是Docker

二、Docker 組件

揹包九講一 01揹包

今天！通義靈碼在北京、成都、杭州三城開講啦

轉載-----jQuery 2.0.3 源碼分析core - 整體架構

SQLServer--TSQL--存儲過程語法

SQLServer--TSQL編程語法

Myeclipse 快捷鍵失靈，設置default快捷鍵---轉載

歡迎使用CSDN-markdown編輯器

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

jQuery 源碼分析 選擇器

([\w-]*))$

jQuery 源碼分析選擇器