水库

  • 数据湖只是个哗众取宠的伪概念吗?

    数据湖是个伪概念吗?最直接的答案是是的,在这篇文章中我会告诉你原因。 最大的问题在于“数据湖”这个词已经不堪重负,被供应商和分析师们赋予了太多不同的含义。如果有什么东西不属于传统的数据仓库架构,那就把...

    2020年8月4日 0 0 0
  • Python Scrapy 爬虫(二):scrapy 初试

    接上篇,之前我们搭建好了运行环境,相当于我们搭好了炮台,现在就差猎物和武器了。 一、选取猎物 此处选择爬取西刺代理 IP 作为示例项目,原因有如下两点: 西刺代理数据规范,爬取简单,作为演示项目比较合适 代...

    2020年8月4日 0 0 2