Google Analytic

2023年7月18日 星期二

爬蟲(WebCrawler )臉書標籤小訣竅 The tips of WebCrawler for facebook webpage

網路爬蟲而言,靜態網頁最好爬,類臉書下拉式網頁(忘了專有名詞抱歉)是最難爬的,且臉書改版頻率很快,故其爬蟲程式需較常維護,而臉書的網頁標籤更是複雜且特有,用 div 刻幾個假按鈕,容易讓人誤會,許多人會搭配selenium套件來做,很多地方會讓人誤會,就是下圖的「按鈕」。







首先 role="button",這樣的div,其實並非按鈕,不直接支援click功能,怎麼說,selenium透過find_element呼叫元素當中的 click() 進行點選是行不通的。



需要透過 javascript 執行點選的部分,有特別使用註解標記,語法如下:driver.execute_script("arguments[0].click();", <元素名稱>)

詳細可參考此網頁 (Python 與自動化測試的敲門磚_Day17_Selenium 瀏覽器基本操作)

沒有留言:

張貼留言

Related Posts Plugin for WordPress, Blogger...