22-0001 淘宝店铺搜索界面

淘宝店铺搜索界面

  • 1.元素
  • 2.过程
    • 2.1 搜索界面的网页源码
    • 2.2 通过Chrome控制台获取sellerid
    • 2.3 搜索链接
    • 2.4 控制台
  • 3.总结

1.元素

  • 获取店铺搜索界面每个店铺的’sellerid’

备注:通过sellerid可以在下面链接中获取买家秀的图片,也可以使用相关软件进行下载。[将最后的xxx替换为sellerid即可]
Link:https://h5.m.taobao.com/ocean/privatenode/shop.html?&sellerId=xxx

2.过程

2.1 搜索界面的网页源码

店铺搜索界面如下:
在这里插入图片描述
备注:每一个界面会有20个结果,结果是根据热度排序的


源码如下:
在这里插入图片描述

trace-uid:与sellerid是一致的
猫受屋:店铺的名字

备注:每一页对应可以搜索得到20个类似的id。

2.2 通过Chrome控制台获取sellerid

//备注:需要保证20个店铺都加载过,否则获取的不完整
tag_list=document.getElementsByClassName("list-img");
str_pr="";
for (var i =0; i < tag_list.length; i++) {a_list=tag_list[i].getElementsByTagName("a");trace_uid=a_list[0].getAttribute("trace-uid");trace_title=a_list[0].title;str_temp=trace_uid+':'+trace_title;str_pr=str_pr+str_temp+'\n';
}
console.log(str_pr);

对应的一段源码如下:
在这里插入图片描述

2.3 搜索链接

如下链接:不能得到任何与第几页相关的内容

url='https://shopsearch.taobao.com/search?q=%E6%89%8B%E5%8A%9E&js=1&initiative_id=staobaoz_20200511&ie=utf8';
'q=%E6%89%8B%E5%8A%9E':搜索的内容,url二次编码
'ie=utf8':编码格式

下翻一页与上一页对比:

url1='https://shopsearch.taobao.com/search?q=%E6%89%8B%E5%8A%9E&js=1&initiative_id=staobaoz_20200511&ie=utf8';
url2='https://shopsearch.taobao.com/search?q=%E6%89%8B%E5%8A%9E&js=1&initiative_id=staobaoz_20200511&ie=utf8&s=20';

可以看到末尾的多了 ‘s=20’ ,可以通过这个链接,每次获取网页源码,从中进行提取。

备注:上面的方法不可行,因为需要进行登录,哈哈~
因此,需要在控制台输入JS代码,将每次的结果进行复制

2.4 控制台

在这里插入图片描述
有这么一项:

url='https://tmatch.simba.taobao.com/?name=tbuad&o=j&count=20&p4p=tbcc_p4p_c2015_8_130026_15891809314781589180932117&pid=430409_1006&keyword=%CA%D6%B0%EC&offset=20';
name='tbuad';
count=20;
p4p='tbcc_p4p_c2015_8_130026_15891809314781589180932117';
pid='430409_1006';
keyword='%CA%D6%B0%EC';
offset=20;

经过了一番测试,得到如下结果:

  • count:返回搜索结果的数目,最大200
  • offset:偏移,从将offset后count个店铺信息返回
  • keyword:类似于url二次编码,但似乎还进行了其他处理,不能直接解码
  • p4p可以去掉
  • pid可以任意修改,但一定要有

类似于一个接口

其中的内容如下:
在这里插入图片描述
备注:果不其然,只有20条数据。
单拎出来一条:
在这里插入图片描述

SELL:卖出的数目
SELLERID:店铺的sellerid
GRADE:类似于热度,数字越大、热度越高
ISMALL:不知道
SHOPNAME:店铺的名字
SHOPID:店铺的id

备注:可以使用python批量获取N条数据,将其排列得到热度较高的店铺。python代码就不贴出来了

3.总结

这才不过是第一篇,以后指定会遇到各种奇奇怪怪的网站~
其中类似于url二次编码的问题,是值得思考与探讨的~

//这两个是如何表示同一种内容的?
//使用Javascript encodeURI() 函数,用于完整的URL编码。',
str1='%E6%89%8B%E5%8A%9E';//encodeURI
//使用Javascript encodeURIComponent() 函数,用于拼接URL的参数。
str2='%CA%D6%B0%EC';//encodeURIComponent

关于图片下载的部分内容:
链接:https://wenshitaiyi.lanzous.com/ichlukf
密码:8pzd
备注:生成的文件夹与该.exe文件在同一个路径下!🤔

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/254060.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

淘宝开店指南——店铺设置篇

目录 店铺基本设置店铺装修手机店铺装修PC 店铺装修 保证金管理客服&#xff08;子账号&#xff09;管理创建子账号修改子账号权限 店铺基本设置 通过千牛主账号工作台左侧点击【店铺】->选择【店铺信息进入】。 设置链接&#xff1a;点击访问 可设置内容&#xff1a; 个…

淘宝/天猫API:seller_info-获得淘宝店铺详情

万邦淘宝/天猫获得淘宝店铺详情 API 返回值说明 seller_info-获得淘宝店铺详情 onebound.taobao.seller_info 公共参数 请求地址: https://console.open.onebound.cn/console/?ipony 名称类型必须描述keyString是调用key&#xff08;必须以GET方式拼接在URL中&#xff09;…

SpringCloud Alibaba Seata 工作机制

SpringCloud Alibaba Seata Seata 工作机制 说明 之所以放在后面说工作机制是因为如果一开始就说的话理解困难 所以我们有了前面的列子和说明我们在结合本节内容会收获的多理解相对容易点 分布式事务过程分析 Seata 分布式事务处理过程-ID三组件模型 debug 梳理: 术语 先…

ShardingSphere笔记(三):自定义分片算法 — 按月分表·真·自动建表

ShardingSphere笔记&#xff08;二&#xff09;&#xff1a;自定义分片算法 — 按月分表真自动建表 文章目录 ShardingSphere笔记&#xff08;二&#xff09;&#xff1a;自定义分片算法 — 按月分表真自动建表一、 前言二、 Springboot 的动态数据库三、 实现我们自己的动态数…

如何创建springboot项目

SpringBoot 优点 可快速构建spring应用直接嵌入tomcat、jetty、undenrtow服务器&#xff08;无须部署war文件&#xff09;提供依赖启动器&#xff08;starter&#xff09;简化构建配置极大程度的自动化配置Spring和第三方库提供生产就绪功能&#xff0c;例如指标监控检测、外部…

函数(C语言程序设计)

目录 一、函数定义 二、函数调用 三、递归函数 四、局部变量和全局变量 一、函数定义 1、无参函数的定义 类型名 函数名&#xff08;&#xff09; /*函数首部*/ { 函数体 } 或 类型名 函数名&#xff08;void&#xff09; /*函数首部*/ { 函数体 } void类型的函数不…

因为修改系统设置导致edge浏览器打不开的最快解决办法

设置&#xff0d;应用&#xff0d;应用与功能&#xff0c;然后找到Microsoft edge点击修改进行修复&#x1f917;

Microsoft Edge打不开了怎么办

相信许多小伙伴都遇到过win10自带浏览器microsoft edge打不开的问题吧&#xff0c;接下来我就教大家怎么做 1.首先&#xff0c;右键单击开始菜单 2.之后单击设置&#xff0c;进入设置。 3.之后分别找到应用-Microsoft Edge&#xff0c;之后单击修改&#xff0c;之后等待修复就…

edge浏览器打不开,有网络能正常上网,但是edge浏览器无法浏览

在edge浏览器设置中&#xff0c;隐私功能往下找到服务提供商 我的是选择的第二个&#xff0c;自己提供服务供应商&#xff0c;后面打不开了 如果是自己填的服务提供商&#xff0c;直接点击第一个&#xff0c;或者直接点击关闭。 速度嘎嘎快

Edge浏览器打不开任何网页!!!

错误代码: STATUS_INVALID_IMAGE_HASH 1、电脑搜索注册表 win键&#xff0c;然后输入“注册表” 2、增加项 找到路径&#xff1a;“计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Microsoft\Edge” 没有Edge的&#xff0c;直接在Microsoft下新建一个Edge文件夹 在Edge下&#…

windows11,打不开IE浏览器,自动跳转到edge浏览器

目前的 暂时解决办法是&#xff0c; 1. 打开 Edge浏览器&#xff0c;--设置 2. 点击左上角 设置--默认浏览器 3. Internet Explorer模式页面--添加 ‘自己需要IE浏览器打开的网址’&#xff0c;然后 就会在 Edge中&#xff0c;再次打开网址尝试&#xff1b;(次模式 会保…

Windows11更新后打不开Edge浏览器解决办法

前几天吐槽win11更新版本后打不开Microsoft Edge浏览器了&#xff0c;特别影响我使用&#xff0c;然后找网上方法&#xff0c;大多让去设置里 修复&#xff0c;就这样&#xff0c;然而没什么卵用&#xff0c;这应该是win11新版本的bug了。 后来看到b站博主 https://b23.tv/QKUh…

微软浏览器Edge打不开怎么办

ctrl shift esc 打开任务管理器 点击窗口内&#xff0c;使其获得焦点&#xff0c;然后切换到英文输入法&#xff0c;输入m(因为edge全称是m开头&#xff0c;这样可以快速找到) 右键&#xff0c;关闭所有edge有关程序&#xff0c;然后进入此目录 C:\Users\&#xff08;你的用…

Microsoft Edge浏览器不兼容解决办法

Microsoft Edge浏览器不兼容解决办法 报错代码&#xff1a;STATUS_INVALID_IMAGE_HASH 步骤 1、按win R键&#xff0c;打开运行命令框。 2、输入 regedit &#xff0c;打开注册表编辑器 3、注册表编辑器窗口中&#xff0c;依次展开到以下路径&#xff1a; HKEY_LOCAL_MACHIN…

Microsoft Edge 嗯...无法访问此页面解决办法

目录 【问题描述】 嗯...无法访问此页面&#xff0c;短短半年遇到两次这个问题&#xff0c;具体如下图所示。 【解决步骤】 1.设置 2.高级设置 3.打开代理设置 4.开启 自动检测设置 &#xff08;初始如图&#xff1a;处于关闭状态&#xff09; 5.恢复正常 【问题描述】…

Win11重置后edge打不开了?

最近有用户发现电脑升级Win11系统&#xff0c;edge浏览器老是出现一些问题&#xff0c;比如edge打不开&#xff0c;无法启动&#xff0c;这该怎么办&#xff1f;针对这一问题&#xff0c;小编给大家带来了详细的解决方法&#xff0c;操作非常简单&#xff0c;快来试试&#xff…

【解决方案】Microsoft Edge 浏览器 出现“无法访问该页面”问题

前言 今天Microsoft Edge 浏览器上网&#xff0c;突然发现输入任何网址都出现了“无法访问该页面”问题。 网上搜了半天发现了一个比较好的解决方法&#xff0c;本人也尝试成功了。 问题分析 浏览器“出现了“无法访问该页面”问题”——网络明明连接正常&#xff0c…

windows更新导致edge打开不了任何页面的解决办法

昨天我电脑上的windows10更新了&#xff0c;也不知道更新了个啥东西 结果今天edge浏览器就打不开网页了&#xff08;如下图&#xff09;&#xff0c;甚至连设置页面也打不开&#xff0c;然而其他浏览器都好好的 查了网上说可能是edge缓存太大&#xff0c;但由于我在edge浏览器连…

数据库服务器

数据库服务器&#xff0c;联系Web服务器与DBMS的中间件是负责处理所有的应用程序服务器&#xff0c;包括在web服务器和后台的应用程序或数据库之间的事务处理和数据访问。 基本信息 中文名 数据库服务器 外文名 database server 功能 数据库服务器建立在数据库系统基础上&a…