python itchat库_用python【itchat】库获取群聊信息的正确姿势

我在《昆明单车骑行群体分析报告(2019版)》中曾用python的itchat模块抓取了我加入的昆明单车群信息,并做了简要分析。

在持续十来天抓取群数据的时候,我发现一个奇怪现象,就是有一个群神出鬼没,有时候能抓到它的信息,有时候不能。

b864c5dbf25f?from=singlemessage

伸出规模的乐途群

从图中可以看到,监测的12天中,乐途群的信息出现了5次,有七天没抓到它的数据。

在我的另一个小号中,我写了一个帖子,对这个“神奇”的现象用我惯有的笔法夸张了一番《骑行之苦,苦在恨水;骑行之乐,乐在乐途》。

我检查了各个群的设置,都是一模一样;我检查了是否itchat有抓取的群数量限制,答案是否定的;我甚至检查了是不是群主为了好玩不定时把我踢出群又把我拉回去。

很明显都是不是以上原因。原因一定出在代码上。

今早我再次检查了代码,终于找到原因所在。

先贴上原来的代码【代码是我在网上抄的,做了简单的调整以适合我的需要】:

#!/usr/bin/env python

# coding: utf-8

import itchat

from itchat.content import TEXT

from itchat.content import *

import sys

import os

import socket

import time

import pandas as pd

import re

import datetime

itchat.auto_login(hotReload=True)

friends = itchat.get_friends(update=True)[0:]

if socket.gethostname()=='xxxx':

root=r'C:\Users\xxxx'

else:

root=r'E:\OneDrive - xxx'

roomslist = []

def getroom_message(n):

#获取群的 username,对群成员进行分析需要用到

itchat.dump_login_status() # 显示所有的群聊信息,默认是返回保存到通讯录中的群聊

RoomList = itchat.search_chatrooms(name=n)

if RoomList is None:

pass

#print("{0} group is not found!".format(name))

else:

# print('取得:',RoomList[0]['UserName'])

return RoomList[0]['UserName']

def getchatrooms():

#获取群聊列表

roomslist = itchat.get_chatrooms()

#print('列表',roomslist)

return roomslist

for i in getchatrooms():

roomslist.append(i['NickName'])

data=[]

for n in roomslist:

ChatRoom = itchat.update_chatroom(getroom_message(n), detailedMember=True)

for i in ChatRoom['MemberList']:

data.append({'群名称':ChatRoom['NickName'],

'省份':i['Province'],

'用户名':i['NickName'],

'ID':i['UserName'],

'性别':i['Sex']})

df=pd.DataFrame(data)

df.to_csv((root+'\jupyter\群数据{}-{}-{}.csv').format(time.localtime().tm_year,time.localtime().tm_mon,time.localtime().tm_mday))

问题处在什么地方?

并不是itchat有bug,而是第一个函数getroom_message(n)出了问题。

RoomList = itchat.search_chatrooms(name=n)

这一行中,原作者用了【name】作为参数传递给函数,我看网上其他资源都是用的这个函数以及这个参数。并且返回的是【RoomList】中第一个元素。

但是检查search_chatrooms()函数源代码可以发现【name】接收的是群聊的名称【NickName】,而【userName】接收的是群聊的id,并且【name】参数会把相似的群聊名称收集到【matchlist】中:

ef search_chatrooms(self, name=None, userName=None):

with self.updateLock:

if userName is not None:

for m in self.chatroomList:

if m['UserName'] == userName:

return copy.deepcopy(m)

elif name is not None:

matchList = []

for m in self.chatroomList:

if name in m['NickName']:

matchList.append(copy.deepcopy(m))

return matchList

所以在我这个例子中,【NickName】包含“云南乐途户外骑行联盟”的有三个群聊,那么getroom_message(n)函数返回的RoomList就有3个群聊名称。由于在python中,list是可变的,其元素位置不固定,所以,当取RoomList的第一个元素时,返回的结果就可能是三个群聊名称中的任意一个而不一定是“云南乐途户外骑行联盟”。

所以我们需要在getroom_message(n)返回的RoomList中再一次判断,每一个元素的【NickName】键对应的值是不是等于参数【n】。

但我又发现,去改这个函数是没有意义的,整个这个getroom_message(n)函数都是多余的。

我们只需要想办法获取到群聊的【userName】,将其放入到一个list中,然后循环获取其相关信息即可,于是有了最终的代码。

最终代码

如下所示:

#!/usr/bin/env python

# coding: utf-8

import itchat

from itchat.content import TEXT

from itchat.content import *

import sys

import os

import socket

import time

import pandas as pd

import re

import datetime

itchat.auto_login(hotReload=True)

friends = itchat.get_friends(update=True)[0:]

if socket.gethostname()=='xxxx':

root=r'C:\Users\xxxx'

else:

root=r'E:\OneDrive - xxx'

roomslist = []

def getchatrooms():

#获取群聊列表

res = itchat.get_chatrooms()

for each in res:

roomslist.append(each['UserName'])

return roomslist

data=[]

for group_id in getchatrooms():

ChatRoom = itchat.update_chatroom(group_id, detailedMember=True)

for i in ChatRoom['MemberList']:

data.append({'群名称':ChatRoom['NickName'],

'省份':i['Province'],

'用户名':i['NickName'],

'ID':i['UserName'],

'性别':i['Sex']})

df=pd.DataFrame(data)

df.to_csv((root+'\jupyter\群数据{}-{}-{}.csv').format(time.localtime().tm_year,time.localtime().tm_mon,time.localtime().tm_mday))

与换来的代码相比,就仅仅是去掉了getroom_message(n)函数,稍微修改了一下getchatrooms()函数,把itchat.update_chatroom()函数的参数直接修改为roomslist中获取的群聊【userName】。

如此一来,名称相似的群聊再也不会神出鬼没地时而出现时而不出现了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/252837.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

灵魂发问

序言 谬论之所以是谬论,因为是没有实际产生作用,每天挂在嘴边的,啊,我要减肥,骗鬼呢,鬼才信。。。灵魂已经枯萎。 学了那么多,记住了几个?认识那么多人,能认识多久&#…

崩坏3服务器维护多久,崩坏35月28日停服维护多久?4.0版本更新内容汇总[图]

崩坏3早已放出消息的4.0版本终于要来了,官方已经发布了更新的公告,将会在5月28日的时候停服,到时候玩家就不能登游戏了,那么本次更新的具体时间是什么时候?还有要持续多久?又有什么新的内容上线&#xff1f…

我的灵魂在哪里?

点击↑上方↑蓝色“编了个程”关注我~ 这是Yasin的第 81 篇原创文章 写在前面 很长一段时间以来,我的脑子里都会偶尔冒出一些问题:我是谁?这个世界是怎么构成的?是真实的吗?上帝存在吗?我为什么会有某某想法…

微信怎么传较大视频?微信怎么传特别大的视频?

微信怎么传较大视频?微信怎么传特别大的视频视频是我们在生活中不可或缺的一部分,随着制作视频的小伙伴越来越多,大家都想把制作好的视频上传到一些平台或传给别人,有时候我们会遇到视频内存过大的问题,今天我给大家介…

视频文件太大怎么发微信朋友?微信怎么发超大或过大的视频文件?

视频文件太大怎么发微信朋友?经常有朋友问我视频太大了怎么压缩,我也找了很多软件,但是都不怎么样好用,小编今天给小伙伴们介绍一个简单的方法视频压缩软件,我在这里介绍一个简单的方法来压缩视频体积: 搜索…

微信传送文件会经过服务器吗,微信可以传送大文件了

今天下午,腾讯微信团队宣布微信现已支持向朋友发送高清视频和图片,且不会被压缩,不过有几点注意事项。目前仅支持最大的文件不能超过200M,不像QQ那样可以支持上G的文件传输。暂未向安卓用户开放,仅在IOS系统上线&#…

微信QQ互传文件

一、QQ传到微信 QQ文件传到微信就比较麻烦了,不过我会详细步骤教大家如何操作的。 操作详解: 第一步:打开桌面上的文件管理,进入后,点击内部储存。 示例图 第二步:点击右上角的放大镜按钮,搜…

小程序上传大文件

目的 小程序 API wx.uploadFile 最大上传文件10M,如果需要上传大于 10M 文件,需要分片上传。 可以利用小程序组件 miniprogram-file-uploader 上传; 步骤 引入组件 进入小程序根目录,运行: npm init npm i miniprogr…

微信视频文件过大,无法传输?教你一招快速压缩文件!

我们都知道微信之间可以进行文件传输,但是有一定的限制,那就是文件需要在30M之内才可以,文件大小超过这个数值是不可以的,那么微信中的视频文件该如何传输呢?教你一招,快速解决! 一般来说&…

微信和QQ如何互传文件?其实方法很简单,手把手教你操作

工作中经常需要互传文件,而经常使用的工具就是微信和QQ。按方便快捷来说,肯定QQ互传文件要好一些。不过在工作中,一般都是加微信好友,QQ则是比较私人的,但是QQ处理文件更加方便?那微信和QQ如何互传文件呢&a…

微信文件过大不能上传?学会这几种方法,再大文件也能轻松发

微信文件过大不能上传?学会这几种方法,再大文件也能轻松发 微信已经逐渐成为办公必须,但微信不支持大文件的发送,那么遇到这种情况,很多小伙伴都会选择用QQ,其实微信也能发送大文件,只要方法用…

怎么远程传输大文件?

在日常工作中,我们常常会遇到将电脑的文件,特别是大文件资料进行传输,比如设计稿件,软件开发包,视频素材等等大文件资料进行传输发送。虽然网络通信技术不断发展,对大数据量,高频次,…

电脑与电脑之间快速传输大文件的方法

概览:传输大型文件 多数人是通过U盘或其他储存设备在计算机之间传输文件(象是转移一些500MB或700MB大小图片)。说实话,如果是传输小文件确实是很好用的办法;但如果今天要转移的是大文件(尤其那些占用大量磁…

HTTP 传输大文件的几种方案

在 JavaScript 中如何实现大文件并发上传? 和 JavaScript 中如何实现大文件并行下载?这两篇文章中,阿宝哥介绍了如何利用 async-pool 这个库来优化传输大文件的功能。本文将为大家介绍一下 HTTP 传输大文件的几种方案。不过在介绍具体的方案之…

如何进行大文件传输?

本文首发微信公众号:码上观世界 网络文件传输的应用场景很多,如网络聊天的点对点传输、文件同步网盘的上传与下载、文件上传到分布式文件存储器等,其传输速度主要受限于网络带宽、存储器大小、CPU处理速度以及磁盘读写速度,尤其是…

HTTP传输大文件

一 概述 早期网络传输的文件非常小,只是一些几K大小的文本和图片,随着网络技术的发展,传输的不仅有几M的图片,还有可以达到几G和几十G的视频。 在这些大文件传输的情况下,100M的光纤或者4G移动网络都会因为网络压力导致…

大文件传输有哪些方式可用?大文件传输有哪些方式?

大文件传输有哪些方式可用?大文件传输有哪些方式?互联网时代,速度决定效率。在企业生产过程中需要进行信息数据交换、搬运。这时就需要进行大文件传输。方方面面的行业都要涉及到大文件传输。例如影视行业需要每天进行视频素材的传输&#xf…

大文件如何快速上传

之前仿造uploadify写了一个HTML5版的文件上传插件,没看过的朋友可以点此先看一下~得到了不少朋友的好评,我自己也用在了项目中,不论是用户头像上传,还是各种媒体文件的上传,以及各种个性的业务需求,都能得到…

如何快速传输大文件,介绍大文件快速方法

现在,企业比以往任何时候都面临着一个重大挑战:需要一个快速共享文件的解决方案。但是,并非所有快速文件传输解决方案都以相同的速度传输文件。文件大小、端点位置、路径、设备、防火墙、网络系统和加密需求都会限制文件的传输速度。 什么是快…

如何快速地向服务器传大文件,大文件如何快速传输

在这个互联网时代,信息更新速度逐渐加快。用户在进行文件传输时,一定是希望既稳定又快速的,并且还能够保证安全。但是通常来讲,FTP文件传输并不能同时实现这三点的,特别是上传大文件时,FTP上传文件速度明显…