找回密碼

火車采集器軟件交流官方論壇

搜索
火車采集器V9版免費下載火車瀏覽器 - 可視采集,萬能群發,全自動腳本工具
查看: 193|回復: 8
打印 上一主題 下一主題

BUG通過XPath來獲取meta content獲取不到

[復制鏈接]
跳轉到指定樓層
1
發表于 2023-3-13 11:40:16 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
BUG通過XPath來獲取meta content獲取不到
規則是//meta[@name="keywords"]/@content
我通過瀏覽器XPath插件跟其他采集器工具使用此XPath規則是能獲取到內容的,

由于需要采集多個不同網頁meta使用前后截取規則方式來匹配大多內容采集不到,后來發現使用XPath方式能成功解決,但是火車頭采集器使用此規則獲取不到內容
http://www.neevlearning.com/spider-197748-1-1.html


2
發表于 2023-3-13 11:54:02 | 只看該作者
采集器是根據源碼采集的,xpath獲取需要符合源碼范圍處理。
3
 樓主| 發表于 2023-3-13 12:09:25 | 只看該作者
leweizxl 發表于 2023-3-13 11:54
采集器是根據源碼采集的,xpath獲取需要符合源碼范圍處理。

源碼里面包含,我使用其他品牌的采集器測試是能成功能拿到,你可以測試下,使用xpath獲取meta內容
4
發表于 2023-3-14 09:10:27 | 只看該作者
wjspwy 發表于 2023-3-13 12:09
源碼里面包含,我使用其他品牌的采集器測試是能成功能拿到,你可以測試下,使用xpath獲取meta內容 ...

節點選outerhtml即可
5
 樓主| 發表于 2023-3-16 21:26:00 | 只看該作者
leweizxl 發表于 2023-3-14 09:10
節點選outerhtml即可

這種方式獲取會包含meta標簽,我只需要內容就行的那種
6
發表于 2023-3-17 09:06:05 | 只看該作者
wjspwy 發表于 2023-3-16 21:26
這種方式獲取會包含meta標簽,我只需要內容就行的那種

采集器里的屬性只能選擇
7
 樓主| 發表于 2023-3-20 14:35:06 | 只看該作者
leweizxl 發表于 2023-3-17 09:06
采集器里的屬性只能選擇

沒有明白。。。。
8
發表于 2023-3-21 09:00:16 | 只看該作者
wjspwy 發表于 2023-3-20 14:35
沒有明白。。。。

意思是,目前只能是這個結果,要去掉代碼做內容替換處理。
您需要登錄后才可以回帖 登錄 | 加入會員

本版積分規則

溫馨提示:建議您聯系官方定制服務,通過官方支付方式完成支付。您與其他非官方賬號發生的交易,我方概不承擔責任。網絡有風險,交易需謹慎

QQ| 手機版|Archiver| 火車采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP備06000549 )

快速回復 返回頂部 返回列表
xxxx18一20岁hd第一次