#思路分享# 前几天,我用webscraper从一个网站,用了2小时,抓了250w个微信号。 经

#思路分享#
前几天,我用webscraper从一个网站,用了2小时,抓了250w个微信号。

经过去重,去掉无效微信号,剩下9w个微信号。

随机抽样测试过,都是真实有效的用户,不是那种不用审核就通过的微信号,当然从签名也可以看出不是微商,也可能有微商。见下图。

有人问我,从哪个网站抓的这些微信号,抱歉,这个真不能告诉你。这是一个朋友告诉我的,说要保密。也是巧,知道这个网站的不知道webscraper,知道webscraper的不知道这个网站,刚好我两个都知道了,于是就抓到了这些数据。

不过我能分享一下,另一个抓取其他微信号的方式,而且是精准粉。不过这种方式就需要你会webscraper或者编程。

下面是具体方式:
————————
在微博界面,搜索“留下微信号”,会发现很多相关帖子,帖子下面的评论都是微信号。如下图:

这个抓取下来后,根据帖子内容,得到的都是相关行业,人群的精准粉。

我来分享下抓取思路:
1、微博搜索关键字得到的网页,作为一级页面。
2、每篇帖子,作为二级页面。
3、在二级页面,抓取下面所以的评论

抓取下来后,可能会有一些无效评论,这个需要你处理一下。

我大致看了下流程,webscraper是可以做到的,有些细节,比如,搜索结果里,需要用鼠标点击一下才能展开留言,这个我都有讲过,没印象的去我那个免费的webscraper星球翻翻。

思路在这里,可能过程中还会有一些具体问题,再说吧。有兴趣的朋友可以试试。

当然,可能用webscraper不能一次性完美抓取,那就分开吧。

先把各个帖子的链接抓下来,放到一个网页,再到各个帖子抓评论。

这个思路也可以用到其他地方抓不同类型的数据,比如邮箱
————————
咦,最后是不是又要推广爬虫课呢?🙅🏻‍♂️不,有兴趣的按图索骥,可以找到哒!

如果有大佬对这些微信号感兴趣,可以加我微信,我提供一部分供测试。

给TA打赏
共{{data.count}}人
人已打赏
生财

抖音 抖音的内容类型总结的挺完整。

2024-4-9 10:48:45

生财

虽然家中事还没处理完,不过也不是一时半会能解决的了的事情,还得继续往前走,接下来将恢复本圈的正常运营

2024-4-9 10:48:49

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索