大数据应用对企业的价值

目录

一、大数据应用价值

1.1 大数据技术分析

1.2 原有技术场景的优化

1.2.1 数据分析优化

1.2.2 高并发数据处理

1.3 通过大数据构建新需求

1.3.1 智能推荐

1.3.2 广告系统

1.3.3 产品/流程优化

1.3.4 异常检测

1.3.5 智能管理

1.3.6 人工智能和机器学习

二、大数据应用价值分析

2.1 数据分析的价值

2.2 大数据技术性能的价值

2.3 构建新需求的价值

三、什么情况下不需要大数据岗位

四、结语


前言:这几年互联网寒冬,时常听到大数据工作者担忧,大数据是开发支持岗位,担心公司业务收缩,先裁大数据岗位;这从侧面说明大数据应用在公司没有体现出该有的价值,大数据应用有哪些价值?为什么没有实现大数据的价值?本文从这两个视角分析。

一、大数据应用价值

       最近几年,到处都能听到大数据这个词,比如大数据推荐,大数据分析,大数据挖掘等;仿佛用大数据这个词就能解释很多没有关联的事;但是大数据到底有哪些应用价值,却没有清晰认识。 一些企业和部门怀着对大数据的期盼,引入了大数据技术开发解决应用场景,发现带来的价值不如预期;大数据的核心特性,是对大数据量的处理能力。什么场景需要,处理能力能干什么?

       对于很多单位或者企业,会有这样的疑惑。笔身深耕在大数据应用一线,从使用者的角度去总结和分析大数据带来的价值,如果无法分析到尽善尽美,希望大家谅解和补充。

上一章基于企业和大数据应用做了详细分析。大数据企业应用场景分析-CSDN博客

1.1 大数据技术分析

      大数据技术就像个新的土地,如何基于新土地优化原有或者构建新东西,大体方向从这两个维度去思考。对于原有技术场景的优化,数据分析、高并发数据处理属于这类;智能推荐、产品/流程优化、异常检测、智能管理、人工智能和机器学习属于第二类,通过大数据技术构建新东西。

1.2 原有技术场景的优化

1.2.1 数据分析优化

       在大数据技术出现以前,数据分析通常在OLTP数据库之上,写SQL用数据库自带引擎做数据分析,数据存储瓶颈分表分库解决,计算性能也得不到保障;大数据技术出现以后,对于业务的分析,可以统一通过数仓产出,且可以跨业务关联分析;除此之外,由于大数据本身的处理能力,以前无法做到的,比如通过日志,或者更细节的埋点分析,都可以通过大数据技术做到业务支持。

对于数据分析的应用优化,这里总结出3个点:

  • 代替OLTP数据库做业务指标计算
  • 解决数据孤岛,跨业务关联分析计算指标
  • 对业务系统运行,构建更细粒度的用户行为分析
1.2.2 高并发数据处理

       在大数据技术出现以前,对于提高业务性能的需求,基本是通过多线程高并发的方式实现,大数据技术将许多高并发的业务场景,简化成几个配置选项,对于一些数据采集、数据处理、数据分析,多数数据驱动的场景,使用大数据技术,能极大的提升业务的性能。

对于数据处理的应用需求,用牺牲部分灵活性的代价,极大的提升了数据处理的性能。

1.3 通过大数据构建新需求

       在大数据技术出现以前,受限于技术性能,许多需求是不合理;得益于大数据技术的出现,可以在高性能的基础上构建一些有价值的新需求,比如产品智能推荐、广告系统、产品/流程优化、异常检测、智能管理、人工智能和机器学习等。

1.3.1 智能推荐

        对于面向市场的产品,内容媒体定制化推荐,能实现更好的用户体验,比如新闻媒体、视屏号等;这些需求要在极快的时间做到人群划分和媒体内容划分,使用大数据技术,实现快速的搜索和准确的推荐功能,交互性能往往在秒级;这样的产品,能在应用市场占据很大的份额。

1.3.2 广告系统

       在巨大的市场用户面前,广告需要满足推荐的精准分析和高效推荐;这需要对产品用户数据的智能管理和分析提出很高的技术要求,和智能推荐的技术架构场景类似,需求场景不同。

1.3.3 产品/流程优化

       这里优化有两个过程,第一个是发现需要优化的部分,第二个是使用大数据技术优化局部性能;比如对于高QPS、快速搜索、快速计算的数据库,使用大数据技术,可以提高业务性能,最简单的场景,将Mysql的详情数据写入ES,使用ES的API提供数据支撑,数据量越大,性能对比效果越好。

1.3.4 异常检测

       得益于大数据技术的数据处理能力,实时性和TPS,对于业务、物联网设备、中间件、产品安全等多种场景,可以使用大数据技术作为核心架构,构建起高效的异常检测系统,为多种场景的安全和运维护航,这对于业务和系统的安全与稳定有很好的作用。

1.3.5 智能管理

       笔者所在的公司,面向市场有上百万的PC电脑,对电脑资产的监控和管理一直是个痛点问题;在APP上埋点SDK工具,使用大数据技术作为采集和分析驱动,定时采集PC状态,将资产信息实时同步到业务系统,很快和稳定的构建起资产管理。

1.3.6 人工智能和机器学习

       对于多数公司,这个应用都是没有落地场景的,但是还是要提一下,大数据和算法的交互:数据特征工程;大数据数据采集、存储和治理是人工智能和机器学习的基石,这个价值按照业界的话来说,价值巨大但落地周期长,在一些基础算法分类、预测、决策的场景经常配合大数据能力一同使用。

二、大数据应用价值分析

对于不同的应用需求,价值的评估角度是不一样的。

2.1 数据分析的价值

       对于数据分析,第一指标的价值,能体现出来的决策支持有效性就是其价值;这需要深入理解业务,并提取出第一性重要性指标,从这个角度,数据开发只是提供大数据的能力支撑,核心是数据分析对业务的理解和指标重要性的评估。

      有些人觉得大数据是业务支持岗位,缺少业务价值,没有岗位安全感;这可能需要从指标的价值上去呈现,大数据应该比业务更理解业务,从中提取出有价值的信息,而不是单独的计算PV、UV这种状态指标,分析指标的变化关系和原因,这是更深一层的价值。

2.2 大数据技术性能的价值

       对于传统后端中间件的性能,已经无法服务大业务场景的需求,引入大数据组件,可以如同之前操作OLTP数据库一样一样,写简单的DSL语句完成业务需求;这依赖了大数据产品的高性能,这一层价值是产品赋予的,是大数据工作者的大数据解决方案。

2.3 构建新需求的价值

       大数据除了数据分析,还能基于大数据技术栈的特新,构建新需求,这些需求的价值,有增加用户体验的智能推荐,或者广告系统,或可以减轻运维压力,或智能异常检查,或安全工程师的风险管理,资产运维等。从大数据技术的视角,这些只能通过大数据技术性能实现的需求,才是大数据工作岗的护城河。

比如智能推荐:需要实现对大量用户的精细化管理,对人群和内容标签分类,对标签人群的快速搜索,对标签内容的快速推荐,这需要极高的接口QPS和搜索推荐性能;这些都是大数据技术擅长的;

比如智能运维:需要实时捕捉大量业务系统、中间件、主机、终端、移动端、供应商等运行的实时日志,实时监控各种系统的稳定性,并对各个模块做到智能检测管理,这是用到了大数据实时吞吐和快速计算检测的能力特性。

比如风险检测:对系统或者终端网络等的安全管理,需要实时监测捕捉大量运行数据,且面对实时变换的风险特征持续更新和增加,这些也依赖大数据技术的高吞吐性能和实时计算能力。

智能管理这些功能类似;

人工智能和机器学习:这些需要依靠大数据的处理能力,替算法构建特征模型,使用算法的能力做分析、决策和预测等应用。

三、什么情况下不需要大数据岗位

       时常在想,为什么大数据岗位有安全感担忧。可能和领导对大数据的期盼有关;

在引入大数据岗位的时候,往往希望大数据能带来有价值的决策支撑,然后落地之后才发现常规的PV/UV计算只能计算指标状态,BI等对决策支撑力度不够,这需要数据分析师赋能;

并且大数据数据库可以直接给后端使用,对应的数据库提供了API接口,可以跳过大数据开发,后端开发者可以直接使用,大数据岗位在中间只做了集成需求,这种岗位需求也不高;

除此之外,数据中台、应用中台的开发,偏向于后端开发,对大数据技术的需求并没有那么大;

这些场景,小数据量的维度计算、对大数据产品的应用、数据中台产品的开发,这些都是对大数据技术的要求没有那么强的要求。

四、结语

       大数据是新的技术生态,技术就是工具,工具就是用来解决问题;对于已有的应用场景,大数据技术提供新的解决方案;对于大数据技术优秀的性能,可以构建新的业务需求;上文提到的应用和应用价值只是思考方向,对于更多的可能性,需要从真实应用需求中挖掘。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2777379.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

【深度学习: ChatGPT 】经验教训:使用 ChatGPT 作为 ML 工程师一天

【深度学习: ChatGPT 】经验教训:使用 ChatGPT 作为 ML 工程师一天 介绍设置过程标杆ChatGPT 做机器学习ChatGPT 能否真正实施这些解决方案?结果结论 TLDR;在最近使用 AI 应用程序 ChatGPT 的用例激增中,我们询问它是否可用于改进…

肯尼斯·里科《C和指针》第12章 使用结构和指针(1)链表

只恨当时学的时候没有读到这本书,,,,,, 12.1 链表 有些读者可能还不熟悉链表,这里对它作一简单介绍。链表(linked list)就一些包含数据的独立数据结构(通常称为节点)的集…

【数学建模】【2024年】【第40届】【MCM/ICM】【A题 七鳃鳗性别比与资源可用性】【解题思路】

我们通过将近半天的搜索数据,查到了美国五大湖中优势物种的食物网数据,以Eric伊利湖为例,共包含34各优势物种,相互之间的关系如下图所示: 一、题目 (一) 赛题原文 2024 MCM Problem A: Reso…

704. Binary Search(二分查找)

题目描述 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。 问题分析 确定左右界,然后按规则进行更新即可 代…

H12-821_73

73.某台路由器Router LSA如图所示,下列说法中错误的是? A.本路由器的Router ID为10.0.12.1 B.本路由器为DR C.本路由器已建立邻接关系 D.本路由器支持外部路由引入 答案:B 注释: LSA中的链路信息Link ID,Data&#xf…

Linux探秘:如何用 find 命令发现隐藏的宝藏

🌟🌌 欢迎来到知识与创意的殿堂 — 远见阁小民的世界!🚀 🌟🧭 在这里,我们一起探索技术的奥秘,一起在知识的海洋中遨游。 🌟🧭 在这里,每个错误都…

python 爬虫篇(3)---->Beautiful Soup 网页解析库的使用(包含实例代码)

Beautiful Soup 网页解析库的使用 文章目录 Beautiful Soup 网页解析库的使用前言一、安装Beautiful Soup 和 lxml二、Beautiful Soup基本使用方法标签选择器1 .string --获取文本内容2 .name --获取标签本身名称3 .attrs[] --通过属性拿属性的值标准选择器find_all( name , at…

动漫风博客介绍页面源码

动漫风博客介绍页面源码,HTML源码,图片背景有淡入切换特效 蓝奏云:https://wfr.lanzout.com/iIDZu1nrmjve

Web前端框架-Vue(初识)

文章目录 web前端三大主流框架**1.Angular****2.React****3.Vue**什么是Vue.js 为什么要学习流行框架框架和库和插件的区别一.简介指令v-cloakv-textv-htmlv-pre**v-once**v-onv-on事件函数中传入参数事件修饰符双向数据绑定v-model 按键修饰符自定义按键修饰符别名v-bind(属性…

RocketMQ生产常见问题

RocketMQ如何保证消息不丢失 1、哪些环节会有丢消息的可能? 其中,1,2,4三个场景都是跨网络的,而跨网络就肯定会有丢消息的可能。关于3这个环节,通常MQ存盘时都会先写入操作系统的缓存page cache中&#xf…

Python中的正则表达式(一)

在Python中,正则表达式是一种用于匹配和操作字符串的强大工具。正则表达式由一系列字符和特殊字符组成,用于定义搜索模式。 在Python中,我们使用内置的 re 模块来操作正则表达式。要使用正则表达式,我们首先需要导入 re 模块。 下…

Android SystemConfig相关

SystemConfig在哪里初始化 它声明在PackageManagerService类的静态方法main()中。在该方法中间定义Injector类对象时,作为它的构造参数。它是调用的SystemConfig.getInstance()实现初始化,之后能通过Injector类对象的getSystemConfig()得到SystemConfig类…

每日五道java面试题之java基础篇(三)

第一题. switch 是否能作⽤在 byte/long/String 上? Java5 以前 switch(expr)中,expr 只能是 byte、short、char、int。从 Java 5 开始,Java 中引⼊了枚举类型, expr 也可以是 enum 类型。从 Java 7 开始,expr 还可以…

自己DIY制作耳机壳一般用哪种材料比较好,性价比比较高

在选择耳机壳的材料时,除了考虑材料本身的性能外,还需要考虑成本、加工难度、耐用性、环保性等方面的因素。 从性能方面来看: 制作耳机壳的UV树脂和塑料材质各有其优缺点。UV树脂具有高硬度、耐磨、耐高温、环保等优点,能够提供更…

Java写标准输出进度条

学Java这么久了,突发奇想写一个 进度条 玩玩,下面展示一下成功吧! Java代码实现如下 public class ProcessBar {public static void main(String[] args) {//进度条StringBuilder processBarnew StringBuilder();//进度条长度int total100;/…

C++——二叉树

引入 map和set特性需要先铺垫二叉搜索树,而二叉搜索树也是一种树形结构 二叉搜索树的特性了解,有助于更好的理解map和set的特性 1.二叉搜索树的概念及优缺点 1.1二叉搜索树的概念 二叉搜索树又称二叉排序树,它或者是一棵空树,或…

windows安装sqlite

windows安装sqlite比linux麻烦很多 1.下载 下载链接:链接 下载dll的zip文件 2.解压并放到文件夹 将压缩包内的文件解压,放到C://sqlite下 3.编辑环境变量 添加到系统变量的path中 4.验证 打开命令提示符,输入 sqlite3有结果就行

DNS 域名系统——应用层

目录 1 域名系统 DNS 1.1 域名系统 1.2 互联网的域名结构 1.2.1 顶级域名 TLD(Top Level Domain) (1) 国家顶级域名 nTLD (2) 通用顶级域名 gTLD (3) 基础结构域名 (infrastructure domain) 1.3 域名服务器 1.3.1 域名服务器的四种类型 (1…

深入理解java之多线程(一)

前言: 本章节我们将开始学习多线程,多线程是一个很重要的知识点,他在我们实际开发中应用广泛并且基础,可以说掌握多线程编写程序是每一个程序员都应当必备的技能,很多小伙伴也会吐槽多线程比较难,但因为其实…

【linux系统体验】-archlinux折腾日记

archlinux 一、系统安装二、系统配置及美化2.1 中文输入法2.2 安装virtualbox增强工具2.3 终端美化 三、问题总结3.1 终端中文乱码 一、系统安装 安装步骤人们已经总结了很多很全: Arch Linux图文安装教程 大体步骤: 磁盘分区安装 Linux内核配置系统(…