当前位置:首页>正文

怎样用python抓取淘宝评论 怎么用python 抓取旅游目的地在线评论

2023-04-27 04:35:31 互联网 未知

怎样用python抓取淘宝评论

#coding=utf-
import urllibimport sys
import json
import re

#设置系统默认编码为utf-reload(sys)
sys.setdefaultencoding("utf-8")

#Only for python
只是简单的示例,没有检查无评论的情况,其它异常也可能没有检查,
你可以根据自己的需要再对代码修改
#解析网页数据
def parseData(html_data, reg_str):
    pattern = re.compile(reg_str)
    result = re.search(pattern, html_data)
    if result:
        return result.groups()
#commodity_url 为商品详情页面
commodity_url = "http://item.taobao.com/item.htm?spm=a1z10.1-c.w4004-9140345655.2.y3LCj0&id=44454286657"

html_data = urllib2.urlopen(commodity_url).read()
#获取用户ID和商品ID
auction_msg = parseData(html_data, ruserNumId=(.*?)&auctionNumId=(.*?)&)
if not auction_msg:
    print "Get reviews failed!"#获取失败,退出
    sys.exit()

reviews_url = "http://rate.taobao.com/feedRateList.htm?callback=jsonp_reviews_list¤tPageNum=1&rateType=&orderType=sort_weight&userNumId=%s&auctionNumId=%s"%auction_msg

response = urllib2.urlopen(reviews_url)
reviews_data = response.read().decode("gbk")

#获取评论数据
json_str = parseData(reviews_data, r((.*)))[0]
if not json_str:
    print "Get reviews failed!"#获取失败,退出
    sys.exit()

jdata = json.loads(json_str)

#下面只打印了第一条评论,如需要打印所有,则遍历jdata["comments"]即可
print jdata["comments"][0]["content"]

怎么用python 抓取旅游目的地在线评论

这个和用不用python没啥关系,是数据来源的问题。 调用淘宝API,使用 api相关接口获得你想要的内容,我 记得api中有相关的接口,你可以看一下接口的说明。 用python做爬虫来进行页面数据的获龋 搜索 希望能帮到你。