共计 6 篇文章

自动领取网易星球黑钻

网易星球是一个基于区块链的价值共享平台。区块链是个好东西,不蹭蹭热度怎么行。前一段时间世界杯,网易星球搞了一个竞猜赢黑钻的活动。黑钻是个人在星球活动的奖励,可以用于星球内的消费和兑换。玩法很简单,就是猜输赢。在我看来跟赌博差不多,不过不赌钱而是赌黑钻。而我也趁着手里有100多个黑钻体验了一把赌博的快感,最后终于输掉了一大半幸幸苦苦每天点点点得来的黑钻。这次活动也造成了黑钻的分配出现了不平衡,贫富差距越来越大。 前言 每天打开星球真的是很麻烦啊,要是有个脚本能自动领岂不是很舒服,而且不会遗漏。 好多天不写 ...

用Python分析一波微信好友

微信几乎是每天都会打开的一个App,今天就来简单分析一下微信好友的一些基本信息。最终目标是爬取所有微信好友并且分析男女比例、个性签名等数据。看似简单的功能用到的库其实不少。主要用到了itchat、matplotlib、wordcloud、jieba、PIL等库。不得不说Python的库是真的多,不过也确实好用。真的是感谢前辈们的付出。 爬取微信好友 爬取微信好友是利用的itchat这个库。itchat是一个开源的微信个人号接口,他的原理是利用了微信网页版的接口。所以使用这个库的时候,你登录的网页版、pc版微信会被顶掉。 ...

抓取百度百科关键字

根据之前学过的基础知识,现在爬取一些简单的静态页面是不成问题了。百度百科页面爬虫,爬取页面词条并打印。因为每个页面词条是很多的,所以每个页面随机取一个词,不断的往下爬取。总共分为3部,即爬取网页、分析网页数据、输出所需资源。组成本爬虫的关键模块分别是URL管理器、HTML下载器和HTML解析器。 github地址 使用方法 1.命令行 cd baike_spider ...

爬虫入门(二):掌握HTTP库requests的基本用法

我们知道,Python内置了urllib等模块用于HTTP请求,然而它的API使用起来并不优雅,于是Requests基于urllib进行了高度封装,使用起来更加简洁、更加人性化。它是Python的一个非常强大的HTTP库。看一下它霸气的介绍 Requests is the only Non-GMO HTTP library for Python, safe for human ...

爬虫入门(一):快速理解HTTP协议

HTTP协议英文名字为(HyperText Transfer Protoco),是一种用于分布式、协作式和超媒体信息系统的应用层协议。在我们日常上网中,无时无刻不在用这个协议。HTTP是万维网的数据通信的基础。 HTTP协议是什么? HTTP 协议是互联网应用中,客户端(浏览器)与服务器之间进行数据通信的一种协议。它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器。协议就是规则,大家都按这个规则来, ...