Tag: 会话cookie cookies

Scrapy – 如何pipe理Cookie /会话: 对于Scrapy如何使用Cookie以及如何pipe理这些Cookie，我有点困惑。这基本上是我想要做的简化版本：网站的工作方式：当你访问网站时，你会得到一个会话cookie。当你进行search时，网站会记住你search的内容，所以当你进入下一页的search结果时，它会知道search结果。我的脚本：我的蜘蛛有一个searchpage_url的开始url search页面被parse()请求，search表单响应被传递给search_generator() search_generator()然后使用FormRequest和search表单响应yield大量的search请求。每个FormRequests和后续的子请求都需要拥有它自己的会话，所以需要拥有它自己的cookiejar和它自己的会话cookie。我已经看到文档的部分，谈论一个元选项，停止被合并的Cookie。这实际上是什么意思？这是否意味着使请求的蜘蛛在其余生命中将拥有自己的cookiejar？如果每个蜘蛛级别的cookie都是这样的，那么当多个蜘蛛产生时它是如何工作的？是否有可能只让第一个请求生成器产生新的蜘蛛，并确保从那时起只有蜘蛛处理未来的请求？我假设我必须禁用多个并发请求。否则，一个蜘蛛会在相同的会话cookie下进行多次search，而将来的请求只会涉及到最近的search？我很困惑，任何澄清将大受欢迎！编辑：我刚刚想到的另一个选项是完全手动pipe理会话cookie，并将其从一个请求传递给另一个。我想这将意味着禁用cookies ..然后从search响应抓取会话cookie，并将其传递给每个后续请求。这是你在这种情况下应该做的吗？