tagName的大小寫問題(QWrap選擇器的一個bug)

今兒寫程序。

對於現代Web前端來說,Selector是必備之物。對於標準瀏覽器,可用querySelector,而對於IE8標準模式以下,需要一個Selector引擎。

因爲本項目會在代碼裏使用QWrap,所以雖然我寫的部分代碼並沒有用QWrap,但既然怎樣都需要一個Selector引擎,不如用QWrap。

結果發生一件悲劇的事情。

我使用html5-shim/shiv庫來讓IE正確解析新的HTML5標籤。但是QWrap引擎居然不能正確選擇出html5的元素。

嘗試人肉選擇,發現是可以的,那就是QWrap的Selector存在bug。

經過艱苦卓絕的鬥爭,最終發現問題出在這個函數的第2行:


function(a) {
sFun.push('el.tagName=="' + a.toUpperCase() + '"');
return '';
}).replace(/([\[(].*)|#([\w\-]+)|\.([\w\-]+)/g,//id縮略寫法//className縮略寫法


QWrap採用了代碼生成技術,即爲selector拼裝出對應的函數。這是一項相當[color=gray]陷阱[/color][u]先進[/u]的技術。

不難看出這裏會產生一個tag的匹配,對於匹配“nav”所生成的代碼應該是:el.tagName=="nav".toUpperCase() 。

通常瀏覽器對於所有HTML元素,其調用tagName返回的都是全大寫字母。


【號外】爲什麼是大寫?

Hax答:這是從HTML的祖先SGML那裏繼承下來的習慣。對於早期寫SGML/HTML的人,要區分標籤和正文內容的最簡單方法恐怕就是把標籤用大寫。

不過,據圈子裏有名的那個紋身佬說,HTML用大寫是因爲那時候技術落後,存儲太緊張,全大寫比較省存儲空間……(大意如此,詳情我記不清了,請八卦人士諮詢Winter)

【/號外】


然而不幸的是,html5-shim以及我所知差不多所有的類似庫,都會使用全小寫。這是因爲現代Web標準的主流是採用全小寫。


【號外】爲什麼換小寫了涅?

Hax答:因爲這樣比較不傷眼,也不傷手。

(每天面對滿屏幕大寫字母的[b]傷不起[/b]啊,看UPPERCASE看到神經衰弱啊,[size=large]有木有,[/size][size=x-large]有木有![/size])
(只能用小鍵盤筆記本打字的[b]傷不起[/b]啊,打UPPERCASE打到小手指抽筋,[size=large]有木有,[/size][size=x-large]有木有![/size])

【/號外】

而IE雖然對於它所能識別的HTML元素都是大小寫不敏感的,但是對於通過[url=http://hax.iteye.com/blog/160999]createElement神經刀[/url]產生的新元素,它其實將其視作類XML元素,也就是大小寫敏感的,所以其tagName屬性將返回最初設定的大小寫形式。

如何fix這個問題?

一個容易想到的方式是把html5-shim裏的標籤列表改爲大寫。不過這個方式並不管用。因爲tagName返回的是最初設定的值,也就是,如果你寫<SECTION>...</SECTION>,返回的是SECTION,如果你寫<SECtion>...</section>返回的就是SECtion(即start tag的大小寫),如果你寫document.createElement('sEcTion'),返回的就是sEcTion。

顯然,QWrap Selector(或任何通用腳本庫)不應依賴網頁作者如何書寫。所以這個問題必須由QW來解決。

此外,庫也不應該假設tagName一定返回大寫。雖然規範規定對於HTML元素tagName應該始終返回大寫,但庫必須考慮兼容性(即這裏所提到的IE的問題)。

此外,通用腳本庫也要有前瞻性,比如考慮Selector引擎用於選擇XML元素。當前各種純JS selector engine並非namespace-aware,所以本不能選擇XML元素。但HTML規範已經允許直接在HTML裏混合MathML、SVG。新的瀏覽器也都已經支持了。

比如你可以試着在FireFox裏看下述代碼:

<body>
<div id="test"><math>
<mi>x</mi>
<mo>=</mo>
<mfrac>
<mrow>
<mo form="prefix">−</mo> <mi>b</mi>
<mo>±</mo>
<msqrt>
<msup> <mi>b</mi> <mn>2</mn> </msup>
<mo>−</mo>
<mn>4</mn> <mo>⁢</mo> <mi>a</mi> <mo>⁢</mo> <mi>c</mi>
</msqrt>
</mrow>
<mrow>
<mn>2</mn> <mo>⁢</mo> <mi>a</mi>
</mrow>
</mfrac>
</math></div>
</body>


你可以看到$('test').firstChild.tagName返回的是“math”而不是“MATH”。而document.querySelector('#test math')也可以正確選擇到該元素。

但是QW Selector就不能選擇到math元素了。

【擴展】
假如你在這個文檔裏插入document.createElement('math')會發生什麼呢?
注意,你插入的不是一個MathML元素,那需要通過createElementNS,加上適當的namespace(http://www.w3.org/1998/Math/MathML)纔可以。你插入的其實是一個名字恰好爲“math”的HTML元素,該元素的tagName返回的是全大寫的“MATH”。

此時,使用getElementsByTagName('math')或document.querySelectorAll('math')會返回這兩個元素。而getElementsByTagName('MATH')或document.querySelectorAll('MATH')只會返回那個正好叫做“math”的HTML元素,而不會返回真正的MathML的math元素。注:FF行爲如此,而目前Chrome是兩者都返回的,這應該是WebKit的bug。
【/擴展】

儘管純JS Selector引擎主要的目的是[b]向前兼容[/b],但若能做到向後兼容就更好了。而QW Selector由於這個小小的大小寫問題,在兩方面都失敗了。

好在,修正它是很容易的。

sFun.push('el.tagName=="' + a.toUpperCase() + '"');
改爲
sFun.push('el.tagName.toLowerCase()=="' + a.toLowerCase() + '"');
即可。

有人可能會問,爲啥全換成toLowerCase()?

之前人家木有說過嗎,UPPERCASE什麼的[size=large]最[/size]討厭了![size=large]有木有![/size][size=x-large]有木有![/size][size=xx-large]有木有![/size]

說正經的,用toLowerCase()是因爲標準所規定的行爲就是這樣的。儘管全換成toUpperCase()似乎也沒有什麼不一樣的。

上述代碼的結果和目前Chrome的行爲較爲一致,即即使是非HTML namespace的元素,也按照大小寫不敏感的方式比較。如果要按照FF的行爲,可以改爲:

'isHTMLElement(el) ? tagName.toLowerCase() == "{a.toLowerCase()}" : tagName == "{a}"'

上述isHTMLElement檢測一個元素是否是HTML元素,邏輯請自行查標準確定。{a}這裏用模板語法,這是爲了讓大家看得更明白,我也省下打許多引號和加號的力氣。


好了,我已經在咆哮體上浪費太多時間了,再不交活,老闆要對我咆哮了。加班去鳥。。。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章