挑战杯 基于情感分析的网络舆情热点分析系统

文章目录

  • 0 前言
  • 1 课题背景
  • 2 数据处理
  • 3 文本情感分析
    • 3.1 情感分析-词库搭建
    • 3.2 文本情感分析实现
    • 3.3 建立情感倾向性分析模型
  • 4 数据可视化工具
    • 4.1 django框架介绍
    • 4.2 ECharts
  • 5 Django使用echarts进行可视化展示
    • 5.1 修改setting.py连接mysql数据库
    • 5.2 导入数据
    • 5.3 使用echarts可视化展示
  • settings.py 文件
  • 6 实现效果
  • 7 最后

0 前言

🔥 优质竞赛项目系列,今天要分享的是

🚩 基于情感分析的网络舆情热点分析系统

该项目较为新颖,适合作为竞赛课题方向,学长非常推荐!

🥇学长这里给一个题目综合评分(每项满分5分)

  • 难度系数:3分
  • 工作量:5分
  • 创新点:3分
  • 界面美化:5分

🧿 更多资料, 项目分享:

https://gitee.com/dancheng-senior/postgraduate

1 课题背景

精神文明日益发展的今天, 出行旅游成为人们的主要休闲方式和社会经济活动, 旅游业不仅能推动多个产业的发展, 调节产业结构,
同时也满足了人们日益增长的文化需要。其越来越成为国民经济的重要支撑。相关数据显示,
疫情平稳期间的旅游人数仍然稳中有增。而与之相对应的是海量的无序化旅游数据日益激增。针对有效旅游数据进行准确分析、 合理预测有助于制定与旅游发展相关的规划,
同时能有效地帮助后续在旅游设施分配和资源调度等方面上制定明智的决策, 发挥旅游信息价值的最大化。由此可知, 旅游经济的发展与对数据的合理分析是密不可分的。

2 数据处理

采用Python爬虫技术对某大同市旅游景点数据进行采集,用Python中的Pandas库对采集到的数据进行整理,
首先将旅游数据转化成DataFrame格式, 再从多个维度和角度进行处理分析。使用isnull函数选取查看缺失值占总数据百分比大于90%的列名及其数值,
认为它在数据分析中提供极其有限信息, 所以直接删除。对缺失数据采用fillna函数根据数据的不同类型进行了固定值填充,
异常值(也称为离群值)检测是一个重要的部分, 用duplicated函数表示重复行的布尔系列值, 返回缺失总数后进行去重。
采用选择(loc)、 分组(groupby)、 连接(merge)、
汇总统计(mean)等方法进行数据的统计与处理。处理完后利用其自带接口将数据存入到mysql数据库中。

3 文本情感分析

3.1 情感分析-词库搭建

通过对大量中文文本及人物会话分析,发现文本情感的判定基本上通过对通篇的情感词、程度副词及否定词的统计分布来判别,因此,我们搭建了基于情感分析的情感词库以及其它辅助词表。如下图所示

在这里插入图片描述

3.2 文本情感分析实现

情感倾向性将文本分为正面、负面、中性三种情感属性,通常由正、负面,以及强弱程度来衡量。本文通过中文分词处理,基于情感词典构建情感表,为每一个分词打分,从而判断判别情感倾向,文本情感分析的流程如下图所示。

在这里插入图片描述

3.3 建立情感倾向性分析模型

通过建立以上基础情感词库作为分析基础,我们对采集的微博网友评论做情感倾向分析,我们将用户评论简单的分为三类

  • 正面情绪
  • 负面情绪
  • 中性

4 数据可视化工具

4.1 django框架介绍

数据可视化是数据处理中的重要部分

Django是一个基于Web的应用框架,由python编写。Web开发的基础是B/S架构,它通过前后端配合,将后台服务器的数据在浏览器上展现给前台用户的应用。Django本身是基于MVC模型,即Model(模型)+View(视图)+
Controller(控制器)设计模式,View模块和Template模块组成了它的视图部分,这种结构使动态的逻辑是剥离于静态页面处理的。
Django框架的Model层本质上是一套ORM系统,封装了大量的数据库操作API,开发人员不需要知道底层的数据库实现就可以对数据库进行增删改查等操作。Django强大的QuerySet设计能够实现非常复杂的数据库查询操作,且性能接近原生SQL语句。Django支持包括PostgreSQL、My
Sql、SQLite、Oracle在内的多种数据库。Django的路由层设计非常简洁,使得将控制层、模型层和页面模板独立开进行开发成为可能。基于Django的Web系统工程结构示意图如图所示。

在这里插入图片描述

从图中可以看到,一个完整的Django工程由数个分应用程序组成,每个分应用程序包括四个部分:

(1)urls路由层:决定Web系统路由结构,控制页面间的跳转和数据请求路径

在这里插入图片描述

(2)views视图层:业务层,主要进行逻辑操作和运算,是前端页面模板和后端数据库之间的桥梁。Django框架提供了大量的数据库操作API,开发人员甚至不需要使用SQL语句即可完成大部分的数据库操作。

在这里插入图片描述

(3)models模型层:Web应用连接底层数据库的关键部分,封装了数据库表结构和实现。开发人员可以在Model层按照Django的指令要求进行建表,无须使用SQL语句或者第三方建表工具进行建表。建表的过程类似于定义变量和抽象编程语言中的类,非常方便。

(4)templates模板层:HTML模板文件,后端数据会填充HTML模板,渲染之后返回给前端请求。考虑到项目周期尽可能小,尽快完成平台的搭建,项目决定采用开源的Django框架开发整个系统的Web应用层。

4.2 ECharts

ECharts(Enterprise
Charts)是百度开源的数据可视化工具,底层依赖轻量级Canvas库ZRender。兼容了几乎全部常用浏览器的特点,使它可广泛用于PC客户端和手机客户端。ECharts能辅助开发者整合用户数据,创新性的完成个性化设置可视化图表。支持折线图(区域图)、柱状图(条状图)、散点图(气泡图)、K线图、饼图(环形图)等,通过导入
js 库在 Java Web 项目上运行。

5 Django使用echarts进行可视化展示

5.1 修改setting.py连接mysql数据库

# settings.py 文件DATABASES = {'default': {'ENGINE': 'django.db.backends.sqlite3','NAME': BASE_DIR / 'db.sqlite3',}
}

5.2 导入数据

导入.sqlite3文件,也可以使用超级用户在 admin 管理页面中添加数据

import requestsfrom django.db import models# Create your models here.# 热点文章class HotArticle(models.Model):article_bid = models.CharField('文章BID', max_length=100)article_uid = models.CharField('文章UID', max_length=100)article_id = models.CharField('文章ID', max_length=100)screen_name = models.TextField('用户昵称')text = models.TextField('微博正文')topics = models.TextField('话题')publish_time = models.DateTimeField('发布时间')location= models.TextField('发布位置')comments_count = models.IntegerField('评论数')reposts_count = models.IntegerField('转发数')publish_tool = models.TextField('发布工具')class Meta:db_table = "hot_article"verbose_name = "热点文章"verbose_name_plural = verbose_nameordering = ('id',)# 用户评论class Comment(models.Model):article_uid = models.CharField('文章UID', max_length=100)article_id = models.CharField('文章ID', max_length=100)username = models.CharField('用户名', max_length=100)text = models.TextField('评论内容')publish_time = models.DateTimeField('发布时间')positive = models.BooleanField('是否积极', null=True, editable=False)prob = models.FloatField('积极估计概率', null=True, editable=False)def save(self, *args, **kwargs):from tools.nlpapi import sentimentif self.prob is None:prob = sentiment(self.text)self.prob = probself.positive = prob >= 0.5super(Comment, self).save(*args, **kwargs)class Meta:db_table = "comment"verbose_name = "用户评论"verbose_name_plural = verbose_name# unique_together = (#     ('article_uid', 'article_id'),# )ordering = ('id',)

5.3 使用echarts可视化展示

  • 设置静态文件目录(即 static 目录)

    settings.py 文件

    STATICFILES_DIRS=(os.path.join(BASE_DIR,'static'),)
    
  • 创建如下目录结构:

在这里插入图片描述

  • js 目录中为 echarts的 js 文件,大家可以在 echarts官网下载自己需要的版本,index.html 文件内容如下

    #部分代码,不完整
    DOCTYPE html>
    <html lang="en"><head><meta charset="UTF-8"><title>基于情感分析的网络舆情热点评估与分析系统title><link rel="stylesheet" href="/static/plugins/bootstrap-3.3.7-dist/css/bootstrap.css"><script type="text/javascript" src="/static/js/jquery.js">script>{% block mainHead %}{% endblock %}
    head>
    <body>
    {% load static %}<nav class="navbar navbar-inverse"><div class="container-fluid"><div class="navbar-header"><a class="navbar-brand" href="#"><img src="{% static 'images/logo.ico' %}" alt="logo" width=24 height=24>a><button type="button" class="navbar-toggle collapsed" data-toggle="collapse" data-target="#bs-example-navbar-collapse-1" aria-expanded="false"><span class="sr-only">Toggle navigationspan><span class="icon-bar">span><span class="icon-bar">span><span class="icon-bar">span>button><a class="navbar-brand" href="#">基于情感分析的网络舆情热点评估与分析系统a>div><div class="collapse navbar-collapse" id="bs-example-navbar-collapse-1"><ul class="nav navbar-nav"><li class="active"><a href="/">首页 <span class="sr-only">(current)span>a>li><li><a href="/weibo_hot_article/">微博热点文章a>li><li><a href="/weibo_comment/">用户评论情感分析a>li>ul><ul class="nav navbar-nav navbar-right"><li><a href="/admin/" target="_blank">前往后台a>li>ul>div>div>nav>{% block mainbody %}<p>originalp>{% endblock %}
    body>
    html>
    
  • 编写 views.py 文件,将数据库中的数据传到前端页面中

    import json
    from multiprocessing import connection
    from sqlite3.dbapi2 import IntegrityErrorfrom django.core import serializers
    from django.core.serializers.json import DjangoJSONEncoder
    from django.forms import model_to_dict
    from django.http import HttpResponse, JsonResponse
    from django.shortcuts import renderdef index(request):# print(request.method)  #获取请求方式GET或POSTreturn render(request, 'index.html')  # 回复一个页面
    

6 实现效果

使用的数据是处理好后已生成的.sqlite数据文件,现在,我们来看一下展示效果,运行


python manage.py runserver

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

7 最后

🧿 更多资料, 项目分享:

https://gitee.com/dancheng-senior/postgraduate

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2808050.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

解决vulhub漏洞环境下载慢卡死问题即解决docker-valhub漏洞环境下载慢的问题

解决vulhub环境下载慢/卡 当前环境为&#xff1a;ubuntu20 1.在 cd /etc/docker/目录下创建或修改daemon.json文件 sudo touch daemon.json编辑daemon.json文件 sudo vim daemon.json2.填写阿里云镜像地址&#xff1a; { "registry-mirrors":["https://6kx…

基础光学系列:(三)揭秘机器视觉中的光圈、焦距与景深的作用

​今天来聊聊成像原理、光圈、焦距和景深&#xff0c;这些概念在摄影、摄像以及机器视觉领域都非常重要。它们共同影响着成像设备捕捉图像的质量和特性。让我们一一解析这些概念以及它们如何在机器视觉行业中应用。 成像原理&#xff1a;怎样把外面的世界捕捉进来 想象一下&a…

Yolov8有效涨点:YOLOv8-AM,采用多种注意力模块提高检测精度,含代码,超详细

前言 2023 年,Ultralytics 推出了最新版本的 YOLO 模型。注意力机制是提高模型性能最热门的方法之一。 本次介绍的是YOLOv8-AM,它将注意力机制融入到原始的YOLOv8架构中。具体来说,我们分别采用四个注意力模块:卷积块注意力模块(CBAM)、全局注意力机制(GAM)、高效通道…

Buffer计算机基础fs模块path模块(day02)

学习源码可以看我的个人前端学习笔记 (github.com):qdxzw/frontlearningNotes 觉得有帮助的同学&#xff0c;可以点心心支持一下哈 一、Buffer 1.概念 Buffer中文译为【缓冲区】&#xff0c;是一个类似于Array的对象&#xff0c;用来表示固定长度的字节序列 简单理解&…

使用免费的L53巧解Freenom域名失效问题

进入2月份以来&#xff0c;不少小伙伴纷纷收到Freenom提供的域名失效&#xff0c;状态由正常变成了Pending。 失效后&#xff0c;域名无法使用&#xff0c;免费的午餐没有了&#xff0c;而现在域名的价格也是水涨船高&#xff0c;真是XXX。很多做外贸的小伙伴表示 难 啊&#x…

“一键焕发视频新生!炫酷色彩变幻特效,让您的创意视频大放异彩!“

在这个视频内容爆炸的时代&#xff0c;如何让您的视频作品脱颖而出&#xff0c;吸引观众的眼球&#xff1f;答案就是——色彩变幻特效&#xff01;通过为视频添加独特的色彩变幻效果&#xff0c;您可以轻松赋予作品无与伦比的魅力和视觉冲击力。 首先第一步&#xff0c;我们要进…

QWidget: Must construct a QApplication before a QWidget 13:25:48: 程序异常结束。

QWidget: Must construct a QApplication before a QWidget 13:25:48: 程序异常结束。 你的插件是release&#xff0c;而你用了debug模式、

[NPUCTF2020]ezinclude ---不会编程的崽

做完这题&#xff0c;又get到一个新的知识点。上界面 源代码里有线索 secret是秘密值&#xff0c;name与pass应该是可以控制的变量。抓个包看看 发送与请求有hash值&#xff0c;没猜错应该是用来验证的。拿去爆破了&#xff0c;啥也没爆破出来。先传参 右边的hash值改变了。猜想…

注解开发总结

目录 注解开发定义bean纯注解开发bean作用范围与生命周期依赖注入——自动装配第三方 bean第三方 bean 管理第三方 bean 依赖注入 XML配置比对注解配置 注解开发定义bean 使用 Component 定义 bean &#xff0c; 括号里面可以认为是 id Component("bookDao") publi…

MATLAB环境下基于图像处理的视网膜图像血管分割

预防糖尿病对每个人的健康至关重要&#xff0c;而糖尿病的早期症状在眼底视网膜血管会有所体现&#xff0c;如静脉血管扩张、轻度弯曲等。高血压作为常见疾病&#xff0c;在中国有多达2.45亿的患者。高血压的病情也会在眼底视网膜血管上有所体现&#xff0c;如交叉压迫征等反映…

Spring篇----第四篇

系列文章目录 文章目录 系列文章目录前言一、区分构造函数注入和 setter 注入二、spring 中有多少种 IOC 容器?三、区分 BeanFactory 和 ApplicationContext。四、列举 IoC 的一些好处。前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大…

Stable Diffusion 3重磅发布

刚不久&#xff0c;Stability AI发布了Stable Diffusion 3.0&#xff0c;这一版本采用了与备受瞩目的爆火Sora相同的DiT架构。通过这一更新&#xff0c;画面质量、文字渲染以及对复杂对象的理解能力都得到了显著提升。由于这些改进&#xff0c;先前的技术Midjourney和DALL-E 3在…

金融知识分享系列之:五日线

金融知识分享系列之&#xff1a;五日线 一、股票均线二、五日线三、五日线加量能三、五日线案例四、五日线案例五、五日线案例六、五日线案例七、五日线案例八、五日线案例 一、股票均线 股票均线是一种用于平滑股票价格的指标。它是根据一段时间内的股票价格计算得出的平均值…

定时任务处理-Spring Task

目录 1 前言 2 cron表达式 2.1 相关概念的介绍 2.2 举个例子(白雪警告) 2.3 使用网站自动生成 3 Spring Task的使用 3.1 导入依赖坐标 3.2 开启任务调度 3.3 自定义定时任务类 1 前言 当我们需要处理一些定时任务的时候就需要用到我们的Spring Task&#xff0c;接下来…

使用命令符用cd切换不了

bug:cd 切换不进去 解决办法&#xff1a; 在cd后面加 /d

林浩然与杨凌芸的Scala奇遇记:从Java王国到函数式编程乐园

林浩然与杨凌芸的Scala奇遇记&#xff1a;从Java王国到函数式编程乐园 在那个代码编织而成的世界里&#xff0c;我们的主人公林浩然和杨凌芸&#xff0c;两位Java领域的编程高手&#xff0c;正在寻找新的挑战。他们曾一起探索过Java丛林中的Lambda表达式的奥秘&#xff0c;也曾…

化学分子Mol2文件格式与使用注意事项

欢迎浏览我的CSND博客&#xff01; Blockbuater_drug …点击进入 文章目录 前言一、Mol2文件示例二、 Mol2文件主要结构解释及注意事项MOLECULE 字段解释ATOM 字段解释BOND 字段解释SUBSTRUCTURE字段解释 总结参考资料 前言 Mol2格式文件是一个ASCII 文件&#xff0c;由Tripos…

Carla自动驾驶仿真七:CARLASUMO真实世界交通流仿真

文章目录 一、SUMO&CARLA背景二、OpenSteerMap使用三、OSM TO XODR四、CARLA加载XODR五、CARLA工程修改六、开始联合仿真七、仿真结束 一、SUMO&CARLA背景 SUMO (Simulation of Urban MObility) 是一个开源的交通模拟软件包&#xff0c;被广泛用于模拟城市交通系统&am…

26.java-单元测试xml注解

单元测试&xml&注解 单元测试 单元测试就是针对最小的功能单元编写测试代码&#xff0c;Java程序最小的功能单元是方法&#xff0c;因此&#xff0c;单元测试就是针对 Java 方法的测试&#xff0c;进而检查方法的正确性。 简单理解 : 就是一个测试代码的工具 目前测试…

栈和堆什么意思,Rust所有权机制又是什么

栈和堆什么意思 栈&#xff1a;存储基本数据类型和引用数据类型的指针引用(地址)&#xff0c;基本数据类型占据固定大小的内存空间。 堆&#xff1a;存储引用数据类型的值&#xff0c;引用数据类型包括对象&#xff0c;数组和函数&#xff0c;在堆中&#xff0c;引用数据类型…