HTTP协议、Wireshark抓包工具、json解析、天气爬虫

 HTTP超文本传输协议

  • HTTP(Hyper Text Transfer Protocol): 全称超文本传输协议,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。

  • HTTP 协议的重要特点: 一发一收,一问一答

  • 明文传输 ,https密文 (加密了的)

现在的主流网站都是https

网址:URL 统一资源定位符

URL

互联网上每个文件都有一个唯一的 URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
    <协议>://<主机>:<端口>/<路径>

    协议:HTTP       80         TCP 
          HTTPS     443         TCP 
    主机:  域名  ->  域名解析服务器 -> IP地址
    端口: 可以省略, HTTP 80
                    HTTPS 443
    路径: 想要获得对应的资源

https://www.example.com/path/to/resource?query=parameter#fragment

•https 是协议,

•www.example.com 是主机名,域名

•/path/to/resource 是路径,

•query=parameter 是查询参数,

•#fragment 是片段标识符。

HTTP交互过程:
    1.建立TCP连接
    2.发送HTTP请求报文
    3.回复HTTP相应报文
    4.关闭TCP连接

要一次建立一次tcp连接,关闭一次连接

HTTP请求报文的格式:

HTTP响应报文格式:

GET 方法
基本介绍:

以下几种方式都会触发 GET 方法的请求

Wireshark 抓包工具

sudo apt-get install wireshark

为什么很多软件都可以用apt-get install安装?

apt-get 是 Debian 及其衍生系统(如 Ubuntu、Linux Mint 等)中的高级包工具(Advanced Package Tool)的命令行接口。

1.集中化的软件仓库: Debian 和其衍生系统维护着庞大的软件仓库,这些仓库包含了成千上万个预编译的软件包。当软件开发者将他们的软件贡献给这些仓库时,软件就变得可供所有使用相同系统的用户通过 apt-get 安装。

2. 依赖关系管理: apt-get 能够解析和处理软件包之间的依赖关系。这意味着当你安装一个软件包时,apt-get 会自动安装所有必要的依赖包,确保软件能够正常运行。这种依赖关系管理大大简化了安装过程。

3.社区贡献和维护: 一个活跃的社区持续为 Debian 和其衍生系统贡献软件包。这些贡献者不仅提供新的软件包,还负责保持现有软件包的更新和维护,确保它们与最新系统兼容。

一般过滤条件先选择协议名  然后用端口过滤。 

先运行网站如何抓取http格式的数据

 Nowapi的ip地址和端口号 为  103.205.5.228:80   

         

GET /?app=weather.today&weaid=%E8%A5%BF%E5%AE%89&appkey=72317&sign=be43b728a4f27463d34f4fcbfea69134&format=json HTTP/1.1
Host: api.k780.com
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/113.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate
Connection: keep-alive
Upgrade-Insecure-Requests: 1

HTTP/1.1 200 OK
Server: nginx
Date: Thu, 18 Jul 2024 08:23:48 GMT
Content-Type: application/json; charset=utf-8;
Transfer-Encoding: chunked
Connection: keep-alive
Access-Control-Allow-Origin: *

{"success":"1","result":{"weaid":"316","days":"2024-07-18","week":".........","cityno":"xian","citynm":"......","cityid":"101110101","temperature":"33.../24...","temperature_curr":"33...","humidity":"75%","aqi":"40","weather":"......","weather_curr":"...","weather_icon":"http://api.k780.com/upload/weather/d/2.gif","weather_icon1":"","wind":"......","winp":"2...","temp_high":"33","temp_low":"24","temp_curr":"33","humi_high":"0","humi_low":"0","weatid":"3","weatid1":"","windid":"8","winpid":"2","weather_iconid":"2"}}

 用httl协议获取今日天气的信息(json格式)

#include"head.h"int CreatTcpClient(char *pip,int port)
{int ret = 0;int sockfd = 0;struct sockaddr_in seraddr;sockfd = socket(AF_INET,SOCK_STREAM,0);if(-1 == sockfd){perror("fail to socket");return -1;}seraddr.sin_family = AF_INET;seraddr.sin_port = htons(port);seraddr.sin_addr.s_addr = inet_addr(pip);ret = connect(sockfd,(struct sockaddr *)&seraddr,sizeof(seraddr));if(-1 == ret){perror("fail to connect ");return -1;}return sockfd;}int SendHttpRequest(int sockfd,char *purl)
{char tmpbuff[4096] = {0};ssize_t nsize = 0;sprintf(tmpbuff,"GET %s HTTP/1.1\r\n",purl);      //%s  用于将 purl里存放的内容拼接到 tmpbuffsprintf(tmpbuff,"%sHost: api.k780.com\r\n",tmpbuff);sprintf(tmpbuff,"%sUser-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/113.0\r\n",tmpbuff);sprintf(tmpbuff,"%sAccept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8\r\n",tmpbuff);sprintf(tmpbuff,"%sAccept-Language: en-US,en;q=0.5\r\n",tmpbuff);sprintf(tmpbuff,"%sConnection: keep-alive\r\n\r\n",tmpbuff);nsize = send(sockfd,tmpbuff,strlen(tmpbuff),0);if(-1 == nsize){perror("fail to send");return -1;}return 0;}int main(int argc, const char *argv[])
{int sockfd = 0;ssize_t nsize = 0;char tmpbuff[4096] = {0};sockfd = CreatTcpClient("103.205.5.228",80);SendHttpRequest(sockfd,"/?app=weather.today&weaid=%E8%A5%BF%E5%AE%89&appkey=72317&sign=be43b728a4f27463d34f4fcbfea69134&format=json");nsize = recv(sockfd,tmpbuff,sizeof(tmpbuff),0);if(-1 == nsize){perror("fial to recv");return -1;}printf("*********RECV***********\n");printf("%s\n",tmpbuff);printf("************************\n");close(sockfd);return 0;
}

 json数据解析

{"success":"1","result":{"weaid":"316","days":"2024-07-18","week":"星期四","cityno":"xian","citynm":"西安","cityid":"101110101","temperature":"33℃/24℃","temperature_curr":"32℃","humidity":"82%","aqi":"41","weather":"多云","weather_curr":"多云","weather_icon":"http://api.k780.com/upload/weather/d/1.gif","weather_icon1":"","wind":"西南风","winp":"1级","temp_high":"33","temp_low":"24","temp_curr":"32","humi_high":"0","humi_low":"0","weatid":"2","weatid1":"","windid":"5","winpid":"1","weather_iconid":"1"}
}

这是一个两层的

JSON格式

一种数据格式

JSON(JavaScript Object Notation)通常用于Web应用程序之间以及客户端与服务器之间的数据交换。

JSON的基本结构包括对象和数组:‘

•对象是一系列无序的键值对。对象以   开始 ,以  结束。每个键后面跟一个冒号 : 每个键值对之间用逗号 , 分隔。

•数组是值的有序集合。数组以 [ 开始,以 ] 结束。值之间使用逗号 , 分隔。

字符串: 

{"name":"code","gender":"male"
}

数字:

{"key1":10,"key2":20.0
}

 数组:

 {"key1" : [0, 1],"key2" : [2, 3]}

允许嵌套 

{"name": "John Doe","age": 30,"isEmployed": true,"address": {"street": "123 Main St","city": "Anytown"},"phoneNumbers": [{"type": "home","number": "555-1234"},{"type": "mobile","number": "555-5678"}]
}

name、age 和 isEmployed 是简单的键值对。address 是一个嵌套的对象,phoneNumbers 是一个包含对象的数组。 

利用cJOSN解析json格式:

http://t.csdnimg.cn/KbuRZ

NowAPI天气爬虫

 json请求

URL: http://api.k780.com/?app=weather.today&weaId=1&appkey=APPKEY&sign=SIGN&format=json

 注意:
        appkey:换成自己的APPKey
        sign:换成自己的sign标识 

1.正常返回
{"success": "1","result": {"weaid": "1","days": "2014-07-30","week": "星期三","cityno": "beijing","citynm": "北京","cityid": "101010100","temperature": "31℃/24℃", /*白天 夜间温度  (注: 夜间只有一个温度如24℃/24℃)*/"temperature_curr": "25℃", /*当前温度*/"humidity": "50%",/*湿度*/"aqi": "100",/*pm2.5 说明详见weather.pm25*/"weather": "多云转晴", /*天气*/"weather_icon": "http://api.k780.com/upload/weather/d/1.gif", /*气象图标 全部气象图标下载*/"weather_icon1": "", /*无意义不必理会*/"wind": "微风",/*风向*/"winp": "小于3级", /*风力*/"temp_high": "31", /*最高温度*/"temp_low": "24", /*最低温度*/"humi_high": "87.8", /*最大湿度 [历史遗留栏位不再更新]*/"humi_low": "75.2", /*最小湿度 [历史遗留栏位不再更新]*/"weatid": "2", /*天气ID,可对照weather.wtype接口中weaid*/"weatid1": "", /*无意义不必理会*/"windid": "1", /*风向ID(暂无对照表)*/"winpid": "2" /*风力ID(暂无对照表)*/"weather_iconid": "1"  /*气象图标编号,对应weather_icon 1.gif*/}
}

 请求报文格式:
 

GET 是最常用的 HTTP 方法,常用于获取服务器上的某个资源。

在浏览器中直接输入 URL 回车或点击浏览器收藏夹中的链接,此时浏览器就会发送出一个 GET 请求。

响应报文格式:
HTTP/1.1 200 OK\r\n
Server: nginx\r\n
Date: Fri, 08 Mar 2024 06:33:44 GMT\r\n
Content-Type: application/json; charset=utf-8;\r\n
Transfer-Encoding: chunked\r\n
Connection: keep-alive\r\n                         
Access-Control-Allow-Origin: *\r\n
\r\n
{"success":"1","result":{"weaid":"316","days":"2024-03-08","week":".........","cityno":"xian","citynm":"......","cityid":"101110101","temperature":"13.../0...","temperature_curr":"12...","humidity":"29%","aqi":"65","weather":"............","weather_curr":"...","weather_icon":"http://api.k780.com/upload/weather/d/0.gif","weather_icon1":"","wind":"......","winp":"2...","temp_high":"13","temp_low":"0","temp_curr":"12","humi_high":"0","humi_low":"0","weatid":"1","weatid1":"","windid":"4","winpid":"2","weather_iconid":"0"}}\r\n
 

  • HTTP 在传输层依赖 TCP 协议,TCP 是面向字节流的。如果没有这个空行,就会出现”粘包问题“所以报文中会有很多 \r\n        
  • 因为 HTTP 协议并没有规定报头部分的键值对有多少个,使用空行就相当于是报文的结束标记或报文和正文之间的分隔符
#include"head.h"
#include "cJSON.h"
int CreatTcpClient(char *pip,int port)
{int ret = 0;int sockfd = 0;struct sockaddr_in seraddr;sockfd = socket(AF_INET,SOCK_STREAM,0);if(-1 == sockfd){perror("fail to socket");return -1;}seraddr.sin_family = AF_INET;seraddr.sin_port = htons(port);seraddr.sin_addr.s_addr = inet_addr(pip);ret = connect(sockfd,(struct sockaddr *)&seraddr,sizeof(seraddr));if(-1 == ret){perror("fail to connect ");return -1;}return sockfd;}int SendHttpRequest(int sockfd,char *purl)
{char tmpbuff[4096] = {0};ssize_t nsize = 0;sprintf(tmpbuff,"GET %s HTTP/1.1\r\n",purl);      //%s  用于将 purl里存放的内容拼接到 tmpbuffsprintf(tmpbuff,"%sHost: api.k780.com\r\n",tmpbuff);sprintf(tmpbuff,"%sUser-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/113.0\r\n",tmpbuff);sprintf(tmpbuff,"%sAccept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8\r\n",tmpbuff);sprintf(tmpbuff,"%sAccept-Language: en-US,en;q=0.5\r\n",tmpbuff);sprintf(tmpbuff,"%sConnection: keep-alive\r\n\r\n",tmpbuff);nsize = send(sockfd,tmpbuff,strlen(tmpbuff),0);if(-1 == nsize){perror("fail to send");return -1;}return 0;}int get_json(char *all_tmpbuff)
{char *start, *end;size_t json_length;cJSON *json = NULL;cJSON *json_result = NULL;cJSON *json_days = NULL;cJSON *json_cityno = NULL;cJSON *json_weather = NULL;// 直接使用 all_tmpbuff,避免不必要的字符串复制start = strchr(all_tmpbuff, '{');if (start == NULL){printf("json data not find\n");return -1;}end = strrchr(all_tmpbuff, '}');if (end == NULL){printf("closing brace not find\n");return -1;}json_length = end - start + 1;// 使用 all_tmpbuff[start, end] 进行解析,无需复制// 解析 JSONjson = cJSON_Parse(start);if (!json){printf("cJSON_Parse error: %s\n", cJSON_GetErrorPtr());return -1;}// 获取 "result" 对象json_result = cJSON_GetObjectItem(json, "result");if (!json_result){printf("Failed to find 'result' object\n");cJSON_Delete(json);return -1;}// 从 "result" 中获取 "days"json_days = cJSON_GetObjectItem(json_result, "days");json_cityno = cJSON_GetObjectItem(json_result, "cityno");json_weather = cJSON_GetObjectItem(json_result, "weather");/*if (!json_days || !cJSON_IsString(json_days)){printf("Failed to find 'days' string\n");cJSON_Delete(json);return -1;}*/printf("days: %s\tcity: %s\tweather %s\n", json_days->valuestring,json_cityno->valuestring,json_weather->valuestring);cJSON_Delete(json);return 0;
}int main(int argc, const char *argv[])
{int sockfd = 0;ssize_t nsize = 0;char tmpbuff[4096] = {0};sockfd = CreatTcpClient("103.205.5.228",80);SendHttpRequest(sockfd,"/?app=weather.today&weaid=%E8%A5%BF%E5%AE%89&appkey=72317&sign=be43b728a4f27463d34f4fcbfea69134&format=json");nsize = recv(sockfd,tmpbuff,sizeof(tmpbuff),0);if(-1 == nsize){perror("fial to recv");return -1;}printf("*********RECV***********\n");printf("%s\n",tmpbuff);printf("************************\n");get_json(tmpbuff);close(sockfd);return 0;
}

 运行结果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3250622.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

简过网:备考25年国考的朋友,你的时间规划做好了吗?

备考25年国考的朋友&#xff0c;你的时间规划做好了吗&#xff1f; 根据以往考试时间&#xff0c;我们先预测一下25年的国考时间&#xff1a; 国考报名&#xff1a;24年10月中旬 国考笔试&#xff1a;24年11月底 省考报名&#xff1a;25年1-2月 省考笔试&#xff1a;25年3…

AnalyticsCloud 分析云 任意文件读取漏洞复现

0x01 产品简介 AnalyticsCloud 分析云集成了先进的数据分析技术和工具&#xff0c;能够处理来自各种数据源的数据&#xff0c;包括云数据、本地数据、传统数据和大数据等。它提供了从数据收集、整理、分析到应用的全链路解决方案&#xff0c;帮助企业更好地理解和利用数据&…

处理.git文件夹过大出现臃肿问题

1、问题背景 在软件开发过程中&#xff0c;版本控制是一个至关重要的环节。Git 作为一种流行的分布式版本控制系统&#xff0c;被广泛应用于各种项目中。然而&#xff0c;近期我们发现在进行项目发版时&#xff0c;Git 克隆项目的时间显著增加&#xff0c;严重影响了发版的效率…

深入理解Java并发编程:从synchronized到Lock的演进

目录 引言 一、synchronized关键字基础 二、Lock接口及其实现 三、ReentrantLock实战 1. 原子类&#xff08;Atomic Classes&#xff09; 2. 并发集合&#xff08;Concurrent Collections&#xff09; 3. 线程池&#xff08;ThreadPool&#xff09; 4. 并发工具类&…

四川赤橙宏海商务信息咨询有限公司真实可靠吗?

在当今数字化浪潮中&#xff0c;电商行业正以前所未有的速度蓬勃发展&#xff0c;而抖音作为短视频领域的佼佼者&#xff0c;其电商服务更是异军突起&#xff0c;成为众多商家争相入驻的新蓝海。四川赤橙宏海商务信息咨询有限公司&#xff0c;正是这一领域的佼佼者&#xff0c;…

【Git标签管理】理解标签 | 创建标签 | 查看标签 | 删除标签 | 推送标签

目录 1.理解标签 2.创建标签 3.查看标签 4.删除本地仓库的标签 5.推送标签 6.删除远程仓库的标签 1.理解标签 Git提供一个打标签的功能tag&#xff0c;对某一次事务/提交的表示&#xff08;作用/意义&#xff09;。标签 tag &#xff0c;可以简单的理解为是对某次 comm…

Python调用搜索引擎Meilisearch

文章目录 简介安装初试参考文献 简介 Meilisearch 是一个 Rust 语言编写的开源搜索引擎&#xff0c;用于快速构建全文搜索。2018 年发布&#xff0c;支持中文。 特点&#xff1a; 速度至上&#xff1a;50 毫秒返回结果。相关性优先&#xff1a;最相关的结果排在前面开发者友好…

request.getParameter()与request.getAttribute()的区别

request.getParameter&#xff08;&#xff09;与request.getAttribute&#xff08;&#xff09;的区别 1、数据来源2、使用范围3、数据类型4、使用场景 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 1、数据来源 getParameter()&#xf…

C#数字医学影像系统(RIS/PACS)源码,Oracle数据库,C/S架构,运行稳定

数字医学影像系统&#xff08;RIS/PACS&#xff09;源码&#xff0c;三甲以下的医院都能满足。PACS 系统全套成品源码。 开发技术&#xff1a;C/S架构&#xff0c;C#开发语言&#xff0c;数据库服务器采用Oracle数据库。 医学影像存储与传输系统&#xff0c;融合了医学信息化…

独立站外链如何影响搜索引擎排名?

独立站的外链对搜索引擎排名有着非常重要的影响。简单来说&#xff0c;外链就像是别的网站对你的网站投的信任票。每一条外链都告诉搜索引擎&#xff1a;“这个网站的内容是有价值的&#xff0c;值得推荐。”因此&#xff0c;外链的数量和质量直接影响你的网站在搜索引擎中的排…

力扣3202:找出有效子序列的最大长度||

class Solution { public:int maximumLength(vector<int>& nums, int k) {int res0;for(int m0;m<k;m){//假设子序列两数%k之后的结果为m 相当于枚举vector<int> v(k,0);for(auto num:nums){v[num%k]v[(m-num%kk)%k]1; //知道m之后可以知道需要的子序列当前…

换了那么多台电脑,这四款高质量软件,从不离身,装机必备

Windows 10退休&#xff0c;Windows 11接棒上阵。 不过&#xff0c;不管Windows系统怎么更新&#xff0c;换多少次电脑或重装系统&#xff0c;这些软件小编总是会第一时间下载回来。 sunlight studio 这款软件堪称DIY爱好者的福音&#xff0c;它将市面上众多出色的硬件工具集…

【echarts】存在左右Y轴,多个图例切换时,图宽度会缩短(没有右轴,图宽度正常。 高亮右轴,图宽度会变窄。)- 已解决

问题描述&#xff1a; 在绘制图表时&#xff0c;左侧 Y 轴有一条曲线&#xff0c;右侧 Y 轴有三条曲线。初始化时发现&#xff0c;图表的宽度变窄了&#xff0c;这在 PC 端不太明显&#xff0c;但在移动端特别明显。 没有右轴&#xff0c;图宽度正常。 高亮右轴&#xff0c;图…

安全防御2

实验要求&#xff1a; 实验过程&#xff1a; 7&#xff0c;办公区设备可以通过电信链路和移动链路上网(多对多的NAT&#xff0c;并且需要保留一个公网IP不能用来转换)&#xff1a; 新建电信区&#xff1a; 新建移动区&#xff1a; 将对应接口划归到各自区域&#xff1a; 新建…

硬件开发——UART/I2C/SPI协议

硬件开发——UART/I2C/SPI协议 小狼http://blog.csdn.net/xiaolangyangyang 1、UART 电压&#xff1a; TTL电平&#xff1a;1&#xff1a;&#xff08;3.3V~5V&#xff09;&#xff0c;0&#xff1a;&#xff08;0V&#xff09;RS232电平&#xff1a;1&#xff1a;&#xff0…

【LeetCode:3112. 访问消失节点的最少时间 + Dijkstra】

&#x1f680; 算法题 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…

springboot校园网络通信系统-计算机毕业设计源码01829

摘要 在当今信息时代&#xff0c;高效的校园网络通信系统对于促进学术交流、管理学生信息和提高教学质量至关重要。该系统基于SpringBoot框架旨在构建一个高效的信息管理平台&#xff0c;为学生、管理员和教师提供全面的学术和管理功能。 系统为学生提供首页、公告消息、校园资…

微信小程序 button样式设置为图片的方法

微信小程序 button样式设置为图片的方法 background-image background-size与background-repeat与border:none;是button必须的 <view style" position: relative;"><button class"customer-service-btn" style"background-image: url(./st…

sip六大头域深度解析:From头域和To头域

From头域用于标识SIP请求的逻辑发起者&#xff0c;即发送请求的用户或设备。它通常包含用户的SIP URI&#xff08;统一资源标识符&#xff09;和可选的显示名称。 To头域用于标识请求的逻辑接收者&#xff0c;To头域的基本格式通常包括一个SIP URI&#xff0c;和显示名&#x…

matplotlib可视化梯度下降

引言 本文主要基于numpy来进行梯度下降的可视化观察&#xff0c;梯度下降本质上是一种迭代技术&#xff0c;它试图从随机猜测开始&#xff0c;为给定模型和数据点找到最佳可能的参数集。 为什么要基于numpy而不直接使用pytorch&#xff1f; 主要是因为pytorch是一个高度封装的…