前言 这是本人一次论文的实验数据搜集,现将其开源,希望该文档能帮到想要爬京东的同学,也希望能有同学提出意见将其完善 使用说明 安装并打开jupyter 对所需的库进行安装 pip install -r requestments.txt 按照指导进行爬取 jd爬虫.ipynb主要对jd的评论进行爬取 文本挖掘对评论的主题进行了提取,并生成词云 TODO 希望有人能指导使用ip池来减少ip被封重连的发生