Tag:

刮/使用JavaScript窃听AJAX数据?

是否有可能使用JavaScript来抓取所有更新到AJAX实时更新​​的网页? 我希望每秒使用AJAX更新数据的网站,我想抓住所有的变化。 这是一个拍卖网站,只要用户下标,几个对象就可以改变。 出价时,出现以下变化: 当前出价当前最高出价者拍卖定时器有时间加回到它 我希望使用基于JavaScript的Chrome扩展来获取这些数据。 有没有一个AJAX的JavaScript的监听器可以做到这一点? 一个工具包? 我需要一些方向。 JavaScript能完成这个吗?

美丽的汤4 find_all找不到美丽的汤3find的链接

我注意到一个非常恼人的bug:BeautifulSoup4(package: bs4 )经常比以前的版本(package: BeautifulSoup )find更less的标签。 以下是该问题的可复制实例: import requests import bs4 import BeautifulSoup r = requests.get('http://wordpress.org/download/release-archive/') s4 = bs4.BeautifulSoup(r.text) s3 = BeautifulSoup.BeautifulSoup(r.text) print 'With BeautifulSoup 4 : {}'.format(len(s4.findAll('a'))) print 'With BeautifulSoup 3 : {}'.format(len(s3.findAll('a'))) 输出: With BeautifulSoup 4 : 557 With BeautifulSoup 3 : 1701 如你所见,差异不是很小。 以下是模块的确切版本,以防有人想知道: In [20]: bs4.__version__ Out[20]: '4.2.1' In [21]: BeautifulSoup.__version__ Out[21]: […]