4399知名游戏-赛尔号图鉴的爬取

4399知名游戏-赛尔号图鉴的爬取

面向对象:

1.疫情居家无聊之人

2.python略懂一点点就行


头文件引入:

如果没有下面的头文件不要慌,打开你的python终端pip install +包名即可

from bs4 import BeautifulSoup
import requests
import json
import os
import sys

爬取赛尔号图鉴:

右键查看网页源代码

右键查看网页源代码你会发现编码方式为’GBK’且有个script,省的我们动态获取链接,可以看到petData是一个二维列表,petData[:,1]是图鉴详情页,点进去看如下所示

在这里插入图片描述
在这里插入图片描述

target = 'http://news.4399.com/seer/jinglingdaquan/'
req = requests.get(target).content.decode('gbk')
html = reqprint('开始爬取...')
bf  = BeautifulSoup(html)
t = bf.select('body > script')    #图鉴页面的详情信息
temp = str(t[0])[22:]
temp = temp[:-12]
lis = json.loads(temp)    #str格式的list转listprint('获取图片html...')
length = len(lis)
html_list = []
for i in range(length):html_list.append(lis[i][1])    #把详情url先存起来
print('载入成功,准备保存...')

先用html_list存储详情页的url,当然可以直接进行下面的转换不用先存
可以更快

F12选中图片发现图片url竟在之中,get后保存本地即可,保存函数如下

def save_img(name,url):  # 保存图片img = requests.get(url)f = open(name, 'ab')f.write(img.content)print(name, '文件保存成功!')f.close()
dirname = input('请输入存图片的文件夹名')
flag = os.path.exists('./'+dirname)
if not flag:os.makedirs('./'+dirname)
else:print('当前文件夹下有同名目录')
for i in range(length):temp = requests.get(html_list[i]).content.decode('gbk')temp_bf = BeautifulSoup(temp)img = temp_bf.select('#state > div.focus.cf > div:nth-child(2) > img')lis_img = str(img).split('"')save_img('./'+dirname+'/'+lis_img[1]+'.jpg',lis_img[3])
now = os.getcwd()
print('爬取完毕!存于'+str(now)+'/'+str(dirname))

写在最后:

当然你们可以不看博客直接复制下面的代码

from bs4 import BeautifulSoup
import requests
import json
import os
import sysdef save_img(name,url):  # 保存图片img = requests.get(url)f = open(name, 'ab')f.write(img.content)print(name, '文件保存成功!')f.close()
target = 'http://news.4399.com/seer/jinglingdaquan/'
req = requests.get(target).content.decode('gbk')
html = reqprint('开始爬取...')
bf  = BeautifulSoup(html)
t = bf.select('body > script')
temp = str(t[0])[22:]
temp = temp[:-12]
lis = json.loads(temp)print('获取图片html...')
length = len(lis)
html_list = []
for i in range(length):html_list.append(lis[i][1])
print('载入成功,准备保存...')dirname = input('请输入存图片的文件夹名')
flag = os.path.exists('./'+dirname)
if not flag:os.makedirs('./'+dirname)
else:print('当前文件夹下有同名目录')#sys.exit(0)
for i in range(967,length):print(i,end = '')try:    #用于爬取精灵(多形态需要额外判断select条件,我懒),有些不符合的get请求结果直接跳过temp = requests.get(html_list[i]).content.decode('gbk')temp_bf = BeautifulSoup(temp)img = temp_bf.select('#state > div.focus.cf > div:nth-child(2) > img')lis_img = str(img).split('"')save_img('./'+dirname+'/'+lis_img[1]+'.jpg',lis_img[3])except:continue
now = os.getcwd()
print('爬取完毕!存于'+str(now)+'/'+str(dirname))

几个注意的地方:

1.这里的切片位置可能会变,你可以选择更加智能的切片,当然,是因为我懒。
在这里插入图片描述
2.这里的select,推荐EDGE浏览器F12选中目标标签,右键复制SELECT即可
在这里插入图片描述
3.为什么要爬赛尔号图鉴呢?
吃饱了撑的,当然不是,准备搭建简易生成对抗网络就叫它SEERGAN吧(手动滑稽)随机生成精灵,效果好的话就好玩了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/353584.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

容器技术 — Cgroups 与 Namespaces 支撑实现的操作系统虚拟化

目录 文章目录 目录操作系统虚拟化(容器技术)的发展历程ChrootCgroupsCgroup SubsystemsCgroup FilesystemCgroup HierarchyCgroups 的操作规则Cgroups 的代码实现 NamespacesUTS namespacePID namespaceIPC namespaceMount namespaceNetwork namespaceU…

使用geoserver发布shp和tiff数据

一、安装并启动geoserver服务 1.1 下载geoserver 进入官网下载 由于geoserver是使用Java语言开发的,所以运行需要java的环境,不同geoserver的版本号对java的版本要求不同,所以选择版本时需注意对应java的版本要求,由于我本地安…

javascript回到顶部

如图: 数字从1到100,滚动后点击章鱼哥便可以回到顶部。 HTML内容不多只有一个a标签内容有一个图片和100个h1标签,但要看清楚是给它设置好了id的,当然不设置id也行但有时候对小白不太友好。 为了使点击图片更加贴合整个页面所以需要…

一段简单的网页返回顶部和返回底部代码(html+css+jquery)

最近用到了返回顶部和底部功能&#xff0c;找了找&#xff0c;查了查&#xff0c;改了改&#xff0c;最终实现效果大概这样子。 以下是相关代码&#xff1a; html部分&#xff1a; <div id"backtotop" class"backtotop"><div class"bt-box…

网页回到顶部的js代码实现

背景 还是给老板写他的个人主页&#xff0c;用到了一个小功能&#xff0c;随手记录下 代码 控制样式的 css 代码如下 /* 回到顶部实现代码的css */ .back-to-top {display: none;/* 默认是隐藏的&#xff0c;这样在第一屏才不显示 */position: fixed;/* 位置是固定的 */bott…

HTML5 回到顶部

图片&#xff1a; html <!DOCTYPE html> <html><head><meta charset"utf-8" /><title>回到顶部</title><link rel"stylesheet" type"text/css" href"css/try.css" /><script src"j…

JS返回顶部代码

2019独角兽企业重金招聘Python工程师标准>>> <!-- 回到顶部 --> <div><span style"font-size:14px"><p id"back-to-top"><a href"#top"><span><img src"public/images/top.jpg" ti…

URL 地址栏能玩出什么新花样?这位歪果程序员小哥给你开开脑洞!

前言 在现在一些互联网营销号的传播素材中&#xff0c;程序员往往会被塑造成一个邋遢、木讷、秃头、低情商的形象&#xff0c;以借此博得普通群众的眼球&#xff0c;吸引他人注意力。 前阵子&#xff0c;暴走漫画发布的一个视频《创造1024》&#xff0c;里面便有多个情节涉及到…

用Python让蔡徐坤在我的命令行里打篮球!| 附完整代码

作者自称是一个经常逛 B 站的肥宅。最近B站上流行的视频素材除了“换脸”&#xff0c;其次就要属“蔡xx打球”视频了。有模仿的、对比的、手绘的... ...更过分的是&#xff0c;竟然有人在命令行输出了他的打球视频。不过&#xff0c;视频中的动画好像是用某个软件生成的 txt 文…

一行代码“黑”掉任意网站

文章目录 只需一行代码&#xff0c;轻轻一点就可以把任意网站变成暗黑模式。 首先我们先做一个实验&#xff0c;在任意网站中&#xff0c;打开浏览器开发者工具(F12)&#xff0c;在 C1onsole 控制台输入如下代码并回车&#xff1a; document.documentElement.style.filterinv…

用Python让蔡徐坤在我的命令行里打篮球!|附完整代码

点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」全日程揭晓&#xff0c;请扫码咨询 ↑↑↑ 来源 | 01二进制&#xff08;ID:gh_d1999add1857&#xff09; 编辑 | Jane 【导语】作者自称是一个经常逛 B 站的肥宅。最近 B 站上流行的视频素材除了“换脸”&#xff0c;其次就…

自动化测试,B、C接口要将A接口返回的参数作为入参,有哪些方法?

在进行自动化测试时&#xff0c;如果需要将A接口返回的参数作为B、C接口的入参&#xff0c;可以通过以下几种方法实现&#xff1a; 如果你想学习自动化测试&#xff0c;我这边给你推荐一套视频&#xff0c;这个视频可以说是B站百万播放全网第一的自动化测试教程&#xff0c;同…

直播带货APP小程序系统开发功能有哪些?

直播带货APP小程序系统开发功能有哪些&#xff1f; 1、直播带货&#xff1a;主播一边带货一边直播间活跃气氛&#xff0c;直观地了解产品&#xff0c;下单的概率会更高。还集有观看、打赏、购物、分享于一体。 2、短视频带货&#xff1a;短视频种草&#xff0c;利…

KCNScrew for Mac(mac序列号工具)

KCNScrew for Mac是一款序列号工具&#xff0c;是一款十分简单好用的序列号查找工具。该软件的数据每个月都会更新&#xff0c;包含将近上千款软件的序列号提供给大家。如果你还在苦恼于软件因为没有序列号而不能正常使用到话&#xff0c;想要查看软件序列号的朋友欢迎&#xf…

CuteFTP,8uftp cuteftp

CuteFTP&#xff0c;FTP工具之一&#xff0c;其传输速度比较快&#xff0c;但有时对于一些教育FTP 站点却无法连接。我在进行ftp工具查找时&#xff0c;还发现了这么一款软件&#xff1a;IIS7服务器管理工具。 作为IIS7服务器管理工具&#xff0c;它可以对ftp站点进行批量管理…

Win10下SCP命令免密码上传、下载工程师服务器上的文件

【1】本地win10操作步骤 1&#xff09;在本地win10系统打开命令行工具&#xff08;winr&#xff09; 2&#xff09;执行命令&#xff1a;ssh-keygen -t rsa 3&#xff09;提示输入保存路径&#xff0c;直接回车&#xff0c;默认即可。 4&#xff09;提示输入密码&#xff0c;因…

CAN-TP帧类型(SF/FF/CF/FC)解析

简介 CAN-TP帧类型可分为 单帧和多帧。 单帧(SF) &#xff1a; Single Frame,数据长度小于等于7个Byte&#xff08;标准CAN是7Byte,CAN-Fd是63Byte&#xff09;时&#xff0c;使用单帧进行传输 多帧可分为 首帧&#xff08;FF&#xff09;/流控帧&#xff08;FC&#xff09;…

tcp 序列号

父 tcp,状态. from异常流程_个人渣记录仅为自己搜索用的博客-CSDN博客 转载请注明出处&#xff1a;6-TCP6-TCP 协议&#xff08;序号和确认号&#xff09;_tcp 最终确认序号_--Allen--的博客-CSDN博客6-TCP 接下来的内容是学习后续内容的基础&#xff0c;必须先讲清楚。为了…

手把手带你YOLOv5/v7 添加注意力机制,30多种模块分析①,SE模块,SK模块

目录 一、注意力机制介绍1、什么是注意力机制&#xff1f;2、注意力机制的分类3、注意力机制的核心 二、SE模块1、SE模块的原理2、代码实例3、实验结果4、应用示例&#xff08;1&#xff09;在 models/yolo.py 文件中定义 SEModule 类&#xff0c;用于实现SE模块。&#xff08;…

安装使用cuteFTP注意事项

花絮&#xff1a; 一直以来都使用红帽的共享文件来让windows和linux之间进行传输文件&#xff0c;今天头脑一发热&#xff0c;想使用windows下的cuteFTP软件来代替前面的方法。可谁想到&#xff0c;一是cuteFTP在网上根本找不到序列号&#xff0c;找了N久没找到&#xff0c;后…