/*
* tokenize方法是選擇器解析的核心函數,它將選擇器轉換成兩級數組groups
* 舉例:
* 若選擇器為“div.class,span”,則解析後的結果為:
* group[0][0] = {type:'TAG',value:'div',matches:match}
* group[0][1] = {type:'CLASS',value:'.class',matches:match}
* group[1][0] = {type:'TAG',value:'span',matches:match}
* 由上述結果可以看出,groups的每一個元素以逗號分隔的選擇器塊的解析結果,
* 另外,上述結果中的matches等於模式匹配的結果,由於在此不方便寫清楚,
* 故只把代碼matches:match寫在這裡。
*
* tokenize方法完成如下兩個主要任務:
* 1、解析選擇器
* 2、將解析結果存入緩存中,以備後用
*
*
* @param selector 待解析的選擇器字符串
* @param parseOnly 為true時,說明本次調用是匹配子選擇器
* 舉個例子:若初始選擇器為"div:not(.class:not(:eq(4))):eq(3)"
* 代碼首先匹配出TAG選擇器div,
* 之後匹配出的pseudo選擇器字符串是:not(.class:not(:eq(4))):eq(3),
* 代碼會把“.class:not(:eq(4))):eq(3”作為not的括號內的值進一步進行解析,
* 此時代碼在調用tokenize解析時,parseOnly參數會傳入true.
*/
function tokenize(selector, parseOnly) {
var matched, match, tokens, type, soFar, groups, preFilters,
// 獲取緩存中的結果
cached = tokenCache[selector + " "];
/*
* 若緩存中有selector對應的解析結果
* 則執行if中語句體
*/
if (cached) {
// 若是對初始選擇器解析(parseOnly!=true),則返回緩存結果,
// 若不是,則返回0
return parseOnly ? 0 : cached.slice(0);
}
/*
* 由於字符串在javascript中不是作為對象來處理的,
* 所以通過賦值,代碼就自動復制了一個新字符串給了soFar,
* 這樣,對soFar的任何處理都不會影響selector的原有數據
*/
soFar = selector;
groups = [];
// 此處賦值,僅僅用於減少後續代碼字數,縮短執行路徑
preFilters = Expr.preFilter;
while (soFar) {
// Comma and first run
/*
* rcomma = new RegExp("^" + whitespace + "*," + whitespace + "*")
* rcomma用來判定是否存在多個選擇器塊,即用逗號隔開的多個並列的選擇器
*
* 下面條件判定依次為:
* !matched:若是第一次執行循環體,則為true;否則為false。
* 這裡matched即作為是否第一次執行循環體的標識,
* 也作為本次循環中soFar是否以非法字符串(即非合法單一選擇器)開頭的標志。
* (match = rcomma.exec(soFar):獲取符合rcomma的匹配項
*/
if (!matched || (match = rcomma.exec(soFar))) {
if (match) {
// Don't consume trailing commas as valid
/*
* 剔除掉第一個逗號及之前的所有字符
* 舉個例子:
* 若初始選擇器為:"div.news,span.closed",
* 在解析過程中,首先由後續代碼解析完畢div.news,剩下",span.closed"
* 在循環體內執行到這裡時,將逗號及之前之後連續的空白(match[0])刪除掉,
* 使soFar變成"span.closed",繼續執行解析過程
*
* 在這裡,若初始選擇器的最後一個非空白字符是逗號,
* 那麼執行下面代碼時soFar不變,即soFar.slice(match[0].length)返回空字符串,
* 故最終返回的是||後面的soFar
*/
soFar = soFar.slice(match[0].length) || soFar;
}
/*
* 在第一次執行循環體或者遇到逗號分割符時,將tokens賦值為一個空數組,
* 同時壓入groups數組
*/
groups.push(tokens = []);
}
matched = false;
// Combinators
/*
* rcombinators = new RegExp(
* "^" + whitespace + "*([>+~]|" + whitespace + ")" + whitespace + "*"),
* rcombinators用來匹配四種關系符,即>+~和空白
*
* 若soFar中是以關系符開始的,則執行if內的語句體
*/
if ((match = rcombinators.exec(soFar))) {
/*
* 將match[0]移除match數組,同時將它賦予matched
* 若原本關系符兩邊帶有空格,則此時match[0]與matched是不相等的
* 舉個例子:
* 若soFar = " + .div";
* 執行match = rcombinators.exec(soFar)後,
* match[0] = " + ",而match[1]="+";
* 執行完matched = match.shift()後,
* matched=" + ",而match[0]="+";
*/
matched = match.shift();
// 將匹配結果壓入tokens數組中
tokens.push({
value : matched,
// Cast descendant combinators to space
/*
* rtrim = new RegExp("^" + whitespace + "+|((?:^|[^\\\\])(?:\\\\.)*)"
* + whitespace + "+$", "g"),
* whitespace = "[\\x20\\t\\r\\n\\f]";
*
* 下面match[0].replace(rtrim, " ")的作用是將match[0]左右兩邊的空白替換為空格
* 但是由於其上的match.shift的作用,match[0]已經是兩邊不帶空白的字符串了,
* 故此出的替換是沒有用途的代碼
*/
type : match[0].replace(rtrim, " ")
});
// 將關系符之後的字符串賦予soFar,繼續解析
soFar = soFar.slice(matched.length);
}
// Filters
/*
* 下面通過for語句對soFar逐一匹配ID、TAG、CLASS、CHILD、ATTR、PSEUDO類型的選擇器
* 若匹配到了,則先調用該類型選擇器對應的預過濾函數,
* 然後,將結果壓入tokens數組,繼續本次循環。
*/
for (type in Expr.filter) {
/*
* match = matchExpr[type].exec(soFar):對soFar調用type類型的正則表達式對soFar進行匹配,
* 並將匹配結果賦予match。若未匹配到數據,則match為undefined。
* !preFilters[type]:若不存在type類型的預過濾函數,則為true
* match = preFilters[type](match):執行預過濾,並將結果返回給match
*
*/
if ((match = matchExpr[type].exec(soFar))
&& (!preFilters[type] || (match = preFilters[type]
(match)))) {
// 將match[0]移除match數組,同時將它賦予matched
matched = match.shift();
// 將匹配結果壓入tokens數組中
tokens.push({
value : matched,
type : type,
matches : match
});
// 將匹配結果之後的字符串賦予soFar,繼續解析
soFar = soFar.slice(matched.length);
}
}
/*
* 若matched==false,
* 則說明本次循環沒有有效的選擇器(包括關系符和id、class等類型選擇器)
* 因此,解析到當前位置遺留下來的soFar是非法的選擇器字符串
* 跳出while循環體
*/
if (!matched) {
break;
}
}
// Return the length of the invalid excess
// if we're just parsing
// Otherwise, throw an error or return tokens
/*
* 若不是對初始選擇器字符串進行解析(!parseOnly==true),
* 則返回soFar.length,此時的soFar.length代表連續有效的選擇器最終位置,
* 後續文章將以實例進行說明
* 若是對初始選擇器字符串進行解析,則看soFar是否還有字符,
* 若是,則執行Sizzle.error(selector)拋出異常;
* 若不是,則執行tokenCache(selector, groups).slice(0)將結果壓入緩存,並返回結果的副本。
*/
return parseOnly ? soFar.length : soFar ? Sizzle.error(selector) :
// Cache the tokens
tokenCache(selector, groups).slice(0);
}