Skip to content

Latest commit

 

History

History
10 lines (10 loc) · 523 Bytes

readme.md

File metadata and controls

10 lines (10 loc) · 523 Bytes

前言

这是本人一次论文的实验数据搜集,现将其开源,希望该文档能帮到想要爬京东的同学,也希望能有同学提出意见将其完善

使用说明

  • 安装并打开jupyter
  • 对所需的库进行安装 pip install -r requestments.txt
  • 按照指导进行爬取
  • jd爬虫.ipynb主要对jd的评论进行爬取
  • 文本挖掘对评论的主题进行了提取,并生成词云

TODO

  • 希望有人能指导使用ip池来减少ip被封重连的发生