作者:某某白米饭
来源:Python 技术
在京东上完成订单的评价都会返还一些京豆当钱用。小编也是一个懒人,不喜欢拍照和评价任何商品,半年都没有去评价任务的商品了。一个个评价太麻烦了,就写了一个 python 脚本自动完成。
取 cookie首先就是要在脚本上登录京东,这里用的是把在浏览器登录的京东账号取到 cookie 后复制到 header 上。
# -*- coding: utf-8 -*-
import requests
from bs4 import BeautifulSoup
import time
import json
headers = {
'cookie': '自己 cookie',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36',
}
获取所有评价数量
在京东的评价页面一共有 4 种评价,待评价订单、待晒单待、追评和服务评价,每个评价后面会跟上数字,表示还有多少个评价没写。
使用 BeautifulSoup 抓取这些内容用于判断是否有需要填写的评价。最终把抓取的数据放到字典中。后面用这个数字做分页基础。
def all_appraisal():
appraisal = {}
url = "http://club.jd.com/myJdcomments/myJdcomment.action?sort=0"
req = requests.get(url, headers=headers)
soup = BeautifulSoup(req.text, "html.parser")
url = soup.find('ul', class_='tab-trigger');
for li in url.find_all('li'):
contents = li.a.text
b = li.b
if b != None:
appraisal[contents] = b.text
return appraisal
示例结果:
{'待评价订单': '17', '待晒单': '1', '待追评': '68', '服务评价': '27'}
待评价订单
在控制面板的网络中,找到提交评价的 url 地址(http://club.jd.com/myJdcomments/saveProductComment.action)。可以看到需要的 post 参数有:订单号,商品号,提交内容和星星数。这里先不发图片评价,在后面的晒图评价中一起做。
通过获取 class_ = 'td-void order-tb' 的 table 获取到每行的订单信息,从而解析到订单号、商品号和商品名称,提交内容就在网上搜一套万能的商品评价模板,星星数都是 5 个。
def be_evaluated():
appraisal = all_appraisal()
for i in range((appraisal['待评价订单'] // 20) 1):
url = 'http://club.jd.com/myJdcomments/myJdcomment.action?sort=0&page={}'.format(i 1)
req = requests.get(url, headers=headers)
soup = BeautifulSoup(req.text, "html.parser")
table = soup.find('table', class_ = 'td-void order-tb');
tbodys = table.find_all('tbody')
for order in tbodys:
oid = order.find('span', class_="number").a.text
product = order.find('div', class_='p-name').a
pname = product.text
pid=product['href'].replace('//item.jd.com/', '').replace('.html', '')
content = pname ',东西质量非常好,与卖家描述的完全一致,非常满意,真的很喜欢,完全超出期望值,发货速度非常快,包装非常仔细、严实,物流公司服务态度很好,运送速度很快,很满意的一次购物'
saveProductComment_url = "http://club.jd.com/myJdcomments/saveProductComment.action"
saveProductComment_data = {
'orderId': oid,
'productId': pid,
'score': '5',
'content': bytes(content, encoding="gbk"),
'saveStatus': '1',
'anonymousFlag': '1'
}
save = requests.post(saveProductComment_url, headers=headers, data=saveProductComment_data)
time.sleep(5)
待晒单
待晒单页面中的订单信息在 class="comt-plists" 的 div 中,每一个订单都是一个个 class="comt-plist" 的 div。用 bs4 很容易就获取到了。
作为一个 python 脚本,怎么可能需要自己拍商品图呢?这里(http://club.jd.com/discussion/getProductPageImageCommentList.action)下载别人的商品图片贴到自己的商品评价中,返回的是一个 json 串。解析后得到第一个 imageUrl。
def be_shown_img():
url = 'http://club.jd.com/myJdcomments/myJdcomment.action?sort=1'
req = requests.get(url, headers=headers)
soup = BeautifulSoup(req.text, "html.parser")
pro_info = soup.find_all('div', class_ = 'pro-info');
for plist in pro_info:
oid = plist['oid']
pid = plist['pid']
img_url = 'http://club.jd.com/discussion/getProductPageImageCommentList.action?productId={}'.format(pid)
img_req = requests.get(img_url, headers=headers)
text = img_req.text
print(img_url)
result = json.loads(text)
imgurl = result["imgComments"]["imgList"][0]["imageUrl"]
saveUrl = 'http://club.jd.com/myJdcomments/saveShowOrder.action'
img_data = {
'orderId': oid,
'productId': pid,
'imgs': imgurl,
'saveStatus': 3
}
print(img_data)
headers['Referer'] = 'http://club.jd.com/myJdcomments/myJdcomment.action?sort=1'
headers['Origin'] = 'http://club.jd.com'
headers['Content-Type'] = 'application/x-www-form-urlencoded'
requests.post(saveUrl, data=img_data, headers=headers)
time.sleep(5)
待追评
追评和评价差不多,不需要上传图片,post 参数只要取得订单号和商品号就可以了。
追评似乎没有特别的标签可以获取订单号和商品号,只能在追评按钮的 href 中截取。
def review():
appraisal = all_appraisal()
saveUrl = 'http://club.jd.com/afterComments/saveAfterCommentAndShowOrder.action'
for i in range((appraisal['待评价订单'] // 20) 1):
url = 'http://club.jd.com/myJdcomments/myJdcomment.action?sort=3&page={}'.format(i 1)
req = requests.get(url, headers=headers)
soup = BeautifulSoup(req.text, "html.parser")
operates = soup.find_all('div', class_='operate')
for o in operates:
href = o.a['href']
infos = href.replace('http://club.jd.com/afterComments/productPublish.action?sku=','').split('&orderId=');
pid = infos[0]
oid = infos[1]
data = {
'orderId': oid,
'productId': pid,
'content': bytes('宝贝和想象中差不多所以好评啦,对比了很多家才选择了这款,还是不错的,很NICE!真的', encoding='gbk'),
'imgs': '',
'anonymousFlag': 1,
'score': 5
}
requests.post(saveUrl, headers=headers, data=data)
time.sleep(5)
服务评价
服务评价的提交很简单,参数只要一个订单号就可以了,只需解析下图的 html。
其他的参数都可以被写死,快递包装的 5 颗星得分的数值:1827A1,送货速度是:1828A1,配送员服务的数值是:1829A1。
def service_rating():
appraisal = all_appraisal()
saveUrl = 'http://club.jd.com/myJdcomments/insertRestSurvey.action?voteid=145&ruleid={}'
for i in range((appraisal['服务评价'] // 20) 1):
url = "http://club.jd.com/myJdcomments/myJdcomment.action?sort=4&page={}".format(i 1)
req = requests.get(url, headers=headers)
soup = BeautifulSoup(req.text, "html.parser")
trs = soup.find_all('tr', class_='tr-th');
for tr in trs:
oid = tr.find('span', class_='number').a.text
saveUrl = saveUrl.format(oid)
data = {
'oid': oid,
'gid': 69,
'sid': 549656,
'stid': 0,
'tags': '',
'ro1827': '1827A1',
'ro1828': '1828A1',
'ro1829': '1829A1',
}
requests.post(saveUrl, headers=headers, data=data)
print('订单号:' oid '服务评价完成')
time.sleep(5)
总结
京东的商品评价脚本比较容易,只用到了 requests 和 bs4 第三方模块,也没有什么加密解密的东西。非常适合刚学爬虫的小伙伴用来练手。
,