【往期福利】
火車采集器
【東哥福利】火車采集器版本選擇攻略
【東哥福利-新手必看】最新最全火車采集器V9版學習資料
【東哥福利】火車采集器V9天貓店鋪信息采集規則分享
【東哥福利】火車采集器V9搜狐社會新聞采集規則分享
【東哥福利】火車采集器V9表格類型采集規則分享
【東哥福利】火車采集器V9網易社會新聞采集規則分享
【東哥福利】火車采集器V9規則58同城租房信息采集分享
【東哥福利】火車采集器V9 unicode漢字編碼轉換案例規則分享
【東哥福利】火車采集器V9澎湃新聞網站信息采集規則分享
火車瀏覽器
【東哥福利】火車瀏覽器采集百度搜索相關詞及下拉詞腳本
【東哥福利】火車瀏覽器管理dede后臺頁面自動更新腳本分享
【東哥福利】火車瀏覽器阿里巴巴商家采集腳本分享
【東哥福利】火車瀏覽器百度地圖商家信息采集詳細講解
-----------------------------------------------------------------------------
東哥微信號tony_lsd,添加請注明:東哥福利
------------------------------------------------------------------------------
【東哥福利】火車瀏覽器微信公眾號文章采集腳本分享
之前給大家分享過火車采集器的微信公眾號文章采集規則,今天分享的是火車瀏覽器采集微信公眾號文章
第一步:創建腳本
打開火車瀏覽器腳本編輯器,新建腳本,起個名字,點擊保存
第二步:編輯腳本流程
1、創建數據存儲目錄,右鍵選擇“文件操作”—>選擇目錄操作
填寫目錄名稱并保存
2、創建數據庫,右鍵選擇“數據庫操作”—>選擇執行Sql語句
填寫Sql語句并保存
3、打開網頁
我們是采集搜狗微信http://weixin.sogou.com/ ,先創建打開網頁步驟,同樣是右鍵選“瀏覽器”—>“打開網頁”
右側上網可以輸入網址http://weixin.sogou.com/ 進行預覽,下方填入網址:http://weixin.sogou.com/ 并保存
這里加一個暫停等待,給一定時間讓網頁加載
4、條件判斷,打開網頁后,要進行一下判斷,網頁是否已經完全加載完,所以這里另一個條件判斷
判斷流程如上圖,判斷條件如下圖,這里是通過Xpath元素來判斷的,就是如果在源碼中找到應該路徑“//form[@id='searchForm']/div/input[3]”表示網頁加載成功,那條件為True 結束循環,如果沒有找到條件為False 繼續等待。
5、輸入關鍵詞,我們在搜狗微信中通過關鍵詞來搜索文章,這里我們也是按此步驟。
首頁左側我們要創建一個元素寫值步驟,然后右側A處是找到搜索框的Xpath 位置元素,B處是添加一個關鍵詞變量,參照下圖
創建變量,起個名稱,寫一個變量值
6、點擊搜索,輸入關鍵詞后,我們需要點擊一下才能執行搜索,如下圖:
然后我們要創建一個點擊的步驟,然后右側 通過Xpath定位“搜文章”的按鈕
然后還是要有個等待,并且有個判斷,和上面的等待和判斷一個意思
7、獲取文章網址,創建一個單次取值
通過Xpath獲取文章網址
對文章地址做一個變量存儲
8、獲取文章頁內容
首先是對文章網址進行請求以獲取頁面
然后是獲取文章標題、依次是時間、作者、內容,獲取的方法原理和火車采集器一樣,通過前后代碼截取內容。
9、將獲取到的內容進行存儲
通過Sql語句存儲
然后這里是保存的目錄和變量
10、流程結束
以下是整個腳本流程的截圖
最后測試運行,都是綠色的就OK了。
東哥對瀏覽器的講解有點粗略,僅供大家學習參考,大家可以觀看官方的視頻教程或者咨詢官方客服。
本腳本為火車瀏覽器腳本,可以直接導入使用,非火車采集器規則。 免費版火車瀏覽器可以導入學習測試 本腳本以采集搜狗微信信息為例,本腳本以通過關鍵詞搜索采集微信公眾號文章信息。 本腳本僅供廣大用戶學習交流參考,不可用以違法目的或商業用途,我們不對因使用此腳本造成的任何法律問題承擔責任。 商業版用戶有問題或付費定制腳本請聯系官方客服QQ:800019423 服務熱線:400-8757-060
歡迎關注官方微信公眾號,及時了解最新信息
![]()
聯系我們
客服QQ:800019423
客服電話:400-8757-060
|