WebDriver原理分析

WebDriver原理分析

WebDriver與之前Selenium的JS注入實現不同,直接利用了瀏覽器native support來操作瀏覽器。所以對於不同平臺,不同的瀏覽器,必須依賴一個特定的瀏覽器的native component來實現把WebDriver API的調用轉化爲瀏覽器的native invoke。

在我們new一個WebDriver的過程中,Selenium首先會確認瀏覽器的native component是否存在可用而且版本匹配。接着就在目標瀏覽器裏啓動一整套Web Service,這套Web Service使用了Selenium自己設計定義的協議,名字叫做 The WebDriver Wire Protocol 。這套協議非常之強大,幾乎可以操作瀏覽器做任何事情,包括打開、關閉、最大化、最小化、元素定位、元素點擊、上傳文件等等等等。

WebDriver Wire協議是通用的,也就是說不管是FirefoxDriver還是ChromeDriver,啓動之後都會在某一個端口啓動基於這套協議的Web Service。例如FirefoxDriver初始化成功之後,默認會從http://localhost:7055開始,而ChromeDriver則大概是http://localhost:46350之類的。接下來,我們調用WebDriver的任何API,都需要藉助一個ComandExecutor發送一個命令,實際上是一個HTTP request給監聽端口上的Web Service。在我們的HTTP request的body中,會以WebDriver Wire協議規定的JSON格式的字符串來告訴Selenium我們希望瀏覽器接下來做社麼事情。

這裏筆者初步畫了一個圖來表示各種WebDriver的工作原理: 

從上圖中我們可以看出,不同瀏覽器的WebDriver子類,都需要依賴特定的瀏覽器原生組件,例如Firefox就需要一個add-on名字叫webdriver.xpi。而IE的話就需要用到一個dll文件來轉化Web Service的命令爲瀏覽器native的調用。另外,圖中還標明瞭WebDriver Wire協議是一套基於RESTful的web service。如果不明白什麼是RESTful的,可以參見筆者之前另外一篇介紹REST的blog( http://blog.csdn.net/ant_yan/article/details/7963517 )

關於WebDriver Wire協議的細節,比如希望瞭解這套Web Service能夠做哪些事情,可以閱讀Selenium官方的 協議文檔 , 在Selenium的源碼中,我們可以找到一個HttpCommandExecutor這個類,裏面維護了一個Map


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章