加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

认识大数据,大数据的技术基础

发布时间:2022-10-31 15:00:23 所属栏目:大数据 来源:网络
导读: 它是数据能够呈现的一个思想基础,也是我们企业要融入这个时代最重要的条件。
这种思维方式很早就诞生了,只不过受限于技术水平,不能够很直观的体现出来,但是互联网时代的到来,催生出了

它是数据能够呈现的一个思想基础,也是我们企业要融入这个时代最重要的条件。

这种思维方式很早就诞生了,只不过受限于技术水平,不能够很直观的体现出来,但是互联网时代的到来,催生出了很多新技术,让很多曾经没有被注意到的信息都能够被采集被记录了,并由此催生出了一系列的新商业模式。那么今天的内容,就是从技术的角度出发,为大家介绍那些对大数据的发展有着有着重要作用的新技术。

为了方便介绍,我把要讲的技术简单分为了“硬件设施”和“软件算法”这两个类别,虽然我把它们分开来讲,但在实际应用的过程中,硬件和软件是相辅相成的,软件需要硬件做基础,硬件也需要软件来做支持,这一点希望大家明白,在我们后面的案例中也会说明这一点。

1、硬件设施

首先我们来了解硬件技术,硬件来采集数据主要是通过一些电子设备以及传感器来实现的,比如说我们常用的电脑和手机,它就是一个各种传感器的综合体,是一个功能强大的数据化的终端,如果我们拿手机打个比方,那么手机的麦克风相当于它的耳朵,用来采集声音信息;镜头是它的眼睛,用捕捉视觉信息;GPS能知道当下的位置;3D陀螺仪能感知到方位的变化;而Wi-Fi和4G是和外界联系的桥梁等等,这些设备最终都会通过与之相关的软件进行数据采集。

除了手机以外,还有很多的其他设备,比如摄像头、红外线热像仪、温度计、噪音监控等等,几乎物理世界中的任何事物都有相对应的传感器,太多了我们就不列举了。你可能会问,诶?你说的这些东西,什么温度计、噪音监控对我们有啥用呢?那么我举个例子。

长虹电器公司希望了解生产过程中哪些因素会对员工的工作效率产生明显的影响,你说效率对他们有用吧?于是他们在自己的生产线设置了很多传感器,用来监测温度、湿度、震动、噪音、颗粒等因素。他们之前都认为温度和颗粒可能对于员工操作和产品质量影响最大,但是等他们数据收集上来一分析,结果是温度没有什么影响,车间恒温的控制对于生产效率和合格率的贡献并不像想象中那么大,反而是噪音对于员工情绪以及生产的影响非常重要,就这一点发现帮助长虹公司做了更具针对性的调整。

通过这个例子,大家应该明白这些设备以及它们采集数据能对企业带来的好处,此外,大家应该还能看到传统企业向数据化转型一个的重要方向,那就是一切的生产经营都需要数据化,这是企业能够通过深入分析来优化自身的基础。

2、软件与算法

接着我们说一下关与软件和算法的技术,这可真是互联网时代的一个大学问。软件收集数据需要软件开发的工程师用代码写好收集数据的算法,然后通过人们在这个软件中的行为和互动,收集他们的数据。我们上一期为大家简单提到过微信大数据,那些互联网公司比如美团、微信、淘宝,是如何量化我们的数据的,准确来说,他们都是数据驱动型的公司。并且我们还提到,数据与数据的融合,还能形成新的数据,那么接下来我们就结合上面提到的手机,从技术上为大家简单介绍一下,数据与数据是如何融合、创造新数据的。

你也许曾遇到过这样的事情,你刚在微信上跟朋友说要去旅游,就在朋友圈看到了机票的广告,你刚刚在电话跟家人说要买奶粉,淘宝就推给你奶粉的广告。这些广告都是怎么来的?为什么这些软件都知道你现在需要什么?淘宝当然不会知道你需要买什么,是你的行为数据让淘宝意识到了你需要婴儿奶粉。

哪些又属于行为数据呢,比如你的消费记录、打车的频率、理财习惯、定位分享、关注的公众号、房贷、车贷、保险等等,这些行为最后会变成几千个实时标签,成为你行为数据的一部分,采集标签并不难难的是建立模型,然后从杂乱的标签中找到你真正的用户兴趣,进而构建用户画像。

举个例子,你打开了一篇内容标签有“美女”的文章,并不意味着你爱看美女,他还需要通过你更多的行为来判断文章对你的吸引力,通过你的评论、收藏、点赞、转发、以及页面停留时间等行为给你的打分,这个分数代表你的短期兴趣。但短期兴趣并不代表长期兴趣,于是每次当你打开一篇关于“美女”的文章时,都会为你的行为打分,再将你一段时间的分数累加,通过一个数学函数标准化,最后会得出一个0-10区间的数,这个数越高就证明你对美女越感兴趣。

除了内容兴趣,这种算法思路还能够在“消费能力”、“消费兴趣”、“社交习惯”等多个维度建立模型,从而计算你的偏好,之后各种偏好会统计起来,形成一个特征向量,你可以理解成一组数据。举个例子,假如你的美女兴趣是8、消费能力是5、社交兴趣是2,就会形成一个包含[8,5,2]的数据。我们可以把这个数据看作是多维空间上的一个坐标,每一个用户都处在这个空间上,然后软件系统会根据数学里面的距离公式,来计算你和其他用户之间的距离,这样就能够找到和你相似的人,把他们感兴趣的商品推送给你,通常你都会对这些商品感兴趣。

当然,这里面还有很多其他复杂的算法,比如找到相似的人之后再通过人工智能的算法来进一步的精确你的用户画像,广告主们就能通过淘宝或腾讯的广告投放平台,精准的找到他们的消费者了,比方说我可以通过腾讯广告的后台,精准的找到“2019年1月1日到1月10日这10天内去过北京机场三次以上的人”,这例很多细节我们就不再细讲了,如果大家感兴趣,可以去看腾讯广告后台的开发者文档,进一步了解你的行为数据被处理到了什么程度。

再补充一点,现在的很多软件比如微信和淘宝,他们采集行为数据不仅仅对应你的账号,更是和你的手机唯一识别码绑定在一起,这意味着你就算不注册不登录,你的行为数据一样会被采集,同时广告平台也可以通过你的手机唯一识别码在其他的软件应用里面向你投放广告。这样一来,你在刷抖音的时候也能够看到淘宝的奶粉广告了。

案例讲完,欢迎回来,我们不得不惊叹互联网公司收集数据以及通过数据挖掘消费市场能力,这就是大数据带来的红利,上面的整个广告投放的过程,我们也可以称之为精准化营销。再对比一下我们大多数传统企业,不说别的,就说广告投放这一点,精准度和转换率通常都非常低,我们很多传统的广告,它更倾向于用来塑造品牌而非精准的找到我们的消费者。关于互联网广告这一块,大家可以去了解一下,我们的另一位老师以后在为大家介绍工具的时候,也会有专门的课程来为大家介绍这些互联网广告,了解了这些,我们在做企业决策的时候,会多很多的选择。

最后我们再总结一下,今天我们主要了解了,为大数据的产生提供了技术条件的那些新技术,两部分,一部分是硬件、一部分是软件和算法,软件需要硬件做基础,硬件也需要软件提供支持,我们还分别用长虹电器工厂和手机广告为大家举了例子来说明这些技术的作用。站在企业的角度来看,有了这些技术,就为企业实现数据化转型提供了极大的支持和帮助,真正的能让企业实现精细化运营和精准化营销。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!