tagName的大小寫問題（QWrap選擇器的一個bug）

今兒寫程序。

對於現代Web前端來說，Selector是必備之物。對於標準瀏覽器，可用querySelector，而對於IE8標準模式以下，需要一個Selector引擎。

因爲本項目會在代碼裏使用QWrap，所以雖然我寫的部分代碼並沒有用QWrap，但既然怎樣都需要一個Selector引擎，不如用QWrap。

結果發生一件悲劇的事情。

我使用html5-shim/shiv庫來讓IE正確解析新的HTML5標籤。但是QWrap引擎居然不能正確選擇出html5的元素。

嘗試人肉選擇，發現是可以的，那就是QWrap的Selector存在bug。

經過艱苦卓絕的鬥爭，最終發現問題出在這個函數的第2行：


	function(a) { 
		sFun.push('el.tagName=="' + a.toUpperCase() + '"');
		return '';
	}).replace(/([\[(].*)|#([\w\-]+)|\.([\w\-]+)/g,//id縮略寫法//className縮略寫法

QWrap採用了代碼生成技術，即爲selector拼裝出對應的函數。這是一項相當[color=gray]陷阱[/color][u]先進[/u]的技術。

不難看出這裏會產生一個tag的匹配，對於匹配“nav”所生成的代碼應該是：el.tagName=="nav".toUpperCase() 。

通常瀏覽器對於所有HTML元素，其調用tagName返回的都是全大寫字母。

【號外】爲什麼是大寫？

Hax答：這是從HTML的祖先SGML那裏繼承下來的習慣。對於早期寫SGML/HTML的人，要區分標籤和正文內容的最簡單方法恐怕就是把標籤用大寫。

不過，據圈子裏有名的那個紋身佬說，HTML用大寫是因爲那時候技術落後，存儲太緊張，全大寫比較省存儲空間……（大意如此，詳情我記不清了，請八卦人士諮詢Winter）

【/號外】

然而不幸的是，html5-shim以及我所知差不多所有的類似庫，都會使用全小寫。這是因爲現代Web標準的主流是採用全小寫。

【號外】爲什麼換小寫了涅？

Hax答：因爲這樣比較不傷眼，也不傷手。

（每天面對滿屏幕大寫字母的[b]傷不起[/b]啊，看UPPERCASE看到神經衰弱啊，[size=large]有木有，[/size][size=x-large]有木有！[/size]）
（只能用小鍵盤筆記本打字的[b]傷不起[/b]啊，打UPPERCASE打到小手指抽筋，[size=large]有木有，[/size][size=x-large]有木有！[/size]）

【/號外】

而IE雖然對於它所能識別的HTML元素都是大小寫不敏感的，但是對於通過[url=http://hax.iteye.com/blog/160999]createElement神經刀[/url]產生的新元素，它其實將其視作類XML元素，也就是大小寫敏感的，所以其tagName屬性將返回最初設定的大小寫形式。

如何fix這個問題？

一個容易想到的方式是把html5-shim裏的標籤列表改爲大寫。不過這個方式並不管用。因爲tagName返回的是最初設定的值，也就是，如果你寫<SECTION>...</SECTION>，返回的是SECTION，如果你寫<SECtion>...</section>返回的就是SECtion（即start tag的大小寫），如果你寫document.createElement('sEcTion')，返回的就是sEcTion。

顯然，QWrap Selector（或任何通用腳本庫）不應依賴網頁作者如何書寫。所以這個問題必須由QW來解決。

此外，庫也不應該假設tagName一定返回大寫。雖然規範規定對於HTML元素tagName應該始終返回大寫，但庫必須考慮兼容性（即這裏所提到的IE的問題）。

此外，通用腳本庫也要有前瞻性，比如考慮Selector引擎用於選擇XML元素。當前各種純JS selector engine並非namespace-aware，所以本不能選擇XML元素。但HTML規範已經允許直接在HTML裏混合MathML、SVG。新的瀏覽器也都已經支持了。

比如你可以試着在FireFox裏看下述代碼：


<body>
<div id="test"><math>
    <mi>x</mi>
    <mo>=</mo>
    <mfrac>
     <mrow>
      <mo form="prefix">−</mo> <mi>b</mi>
      <mo>±</mo>
      <msqrt>
       <msup> <mi>b</mi> <mn>2</mn> </msup>
       <mo>−</mo>
       <mn>4</mn> <mo>⁢</mo> <mi>a</mi> <mo>⁢</mo> <mi>c</mi>
      </msqrt>
     </mrow>
     <mrow>
      <mn>2</mn> <mo>⁢</mo> <mi>a</mi>
     </mrow>
    </mfrac>
   </math></div>
</body>

你可以看到$('test').firstChild.tagName返回的是“math”而不是“MATH”。而document.querySelector('#test math')也可以正確選擇到該元素。

但是QW Selector就不能選擇到math元素了。

【擴展】
假如你在這個文檔裏插入document.createElement('math')會發生什麼呢？
注意，你插入的不是一個MathML元素，那需要通過createElementNS，加上適當的namespace（http://www.w3.org/1998/Math/MathML）纔可以。你插入的其實是一個名字恰好爲“math”的HTML元素，該元素的tagName返回的是全大寫的“MATH”。

此時，使用getElementsByTagName('math')或document.querySelectorAll('math')會返回這兩個元素。而getElementsByTagName('MATH')或document.querySelectorAll('MATH')只會返回那個正好叫做“math”的HTML元素，而不會返回真正的MathML的math元素。注：FF行爲如此，而目前Chrome是兩者都返回的，這應該是WebKit的bug。
【/擴展】

儘管純JS Selector引擎主要的目的是[b]向前兼容[/b]，但若能做到向後兼容就更好了。而QW Selector由於這個小小的大小寫問題，在兩方面都失敗了。

好在，修正它是很容易的。

sFun.push('el.tagName=="' + a.toUpperCase() + '"');
改爲
sFun.push('el.tagName.toLowerCase()=="' + a.toLowerCase() + '"');
即可。

有人可能會問，爲啥全換成toLowerCase()？

之前人家木有說過嗎，UPPERCASE什麼的[size=large]最[/size]討厭了！[size=large]有木有！[/size][size=x-large]有木有！[/size][size=xx-large]有木有！[/size]

說正經的，用toLowerCase()是因爲標準所規定的行爲就是這樣的。儘管全換成toUpperCase()似乎也沒有什麼不一樣的。

上述代碼的結果和目前Chrome的行爲較爲一致，即即使是非HTML namespace的元素，也按照大小寫不敏感的方式比較。如果要按照FF的行爲，可以改爲：

'isHTMLElement(el) ? tagName.toLowerCase() == "{a.toLowerCase()}" : tagName == "{a}"'

上述isHTMLElement檢測一個元素是否是HTML元素，邏輯請自行查標準確定。{a}這裏用模板語法，這是爲了讓大家看得更明白，我也省下打許多引號和加號的力氣。

好了，我已經在咆哮體上浪費太多時間了，再不交活，老闆要對我咆哮了。加班去鳥。。。

tagName的大小寫問題（QWrap選擇器的一個bug）

如何使用 JS 判斷用戶是否處於活躍狀態

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

聲明：本人停止更新JavaEye博客15天

關於CITE標籤的想法

從一個上古屬性urn說起

給IE打補丁技巧之CSS Expression

Approach to HTML5 演講預告

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結