一、代码部分
import time
import re
import win32clipboard as w
import win32con
import datetime
import json
class Application():
def __init__(self):
self.web_driver()
def web_driver(self):
self.driver = webdriver.Firefox()
url1 = "https://m.weibo.cn/u/2858745682"
self.driver.get(url1)
time.sleep(3)
# 登录cookie
with open(r'cookies_cn.txt', 'r', encoding='utf-8') as f: # 需要在代码同一个目录中把cookie 放到cookies_cn.txt 中
Cookies = json.loads(f.read())
for cookie in Cookies:
try:
self.driver.add_cookie(cookie) # 增加cookies
except:
print("cookie is error")
# 登录完成刷新
self.driver.refresh()
time.sleep(7)Application()
二、获取cookie
Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)
比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以登陆i,然后再抓取其他页面就达到目的了。
1.使用cookie Editor (推荐)
以edge 为列:
进入扩展中心获取
安装完成后,在已登陆页面使用扩展点击,export (复制到剪切板)
在运行代码文件夹中,创建cookies_cn.txt 并把cookie 复制到此文件中。运行即可登陆。
2.F12 中复制 cookie,点击网络。使用找到登陆页面头文件中,请求头。格式可参考cookie edior 中调整对应文件。
文章评论