big data

发布时间:2014-11-22 12:17:03   来源:文档文库   
字号:

南京财经大学

大数据时代的信息分析报告

摘要

世界上第一台电脑ENIAC1946年2月14日在美国宾夕法尼亚大学诞生到21世纪,我们已经加速迈向信息化时代,就像我们在日常生活中的生活,工作,交流一样,电脑的来临和互联网的普及,我们的生活已经越来越离不开电脑,我们通过它获取全球的信息,了解各式各样的风俗民情;和世界各地的人交流着思想,让思维在这个看不见的网碰出耀眼的火花;同时我们也通过网络来消费,买卖我们需要的和别人需要的商品……而在这日益新颖的信息时代,我们在日常活动中产生的巨大信息即我们所说的大数据,本文大数据和大数据分析来了解大数据和平常的数据有何不同,现在的信息时代大数据的重要性及其操作性弊端,然后再谈及关于大数据的两面性,从而知晓我们要合理,正确的使用大数据。

关键词:大数据 数据的价值 数据的使用

目录

摘要-----------------------------------------------2

目录-----------------------------------------------3

正文-----------------------------------------------4

引言-----------------------------------------------4一.数据

1.1大数据------------------------------------------4

1.2大数据历史--------------------------------------5

1.3大数据的的实用不足之处--------------------------6

二.大数据的实际意义

2.1阿里巴巴大数据--------------------------------8

三.实践国家电网和大数据 ---------------------------9

.总结--------------------------------------------10

.参考文献----------------------------------------10

引言

有人说,大数据就像是国王的“新衣”,每个人都在国王的面前说着动听的话,而当我们穿上这件美丽的衣服时,我们才发现大数据不仅仅是一件看不见的衣服,也不再是那些谄媚的佞臣的虚言;而是我们真正的看到的,真正的感受到他的大的维度,大数据包括多个维度,三维上的维度让我们联系着世界各地,时间上的维度使我们纵观过去与现在,思维的维度让我们彼此联系着,虚拟的维度更是在我们日常生活中画下一笔浓墨重彩; 本文从大数据和大数据分析来了解大数据和平常的数据有何不同,现在的信息时代大数据的重要性及其操作性弊端,然后再谈及关于大数据的两面性,从而知晓我们要合理,正确的使用大数据,同时应用软件对大数据管理和使用方面做一个系统性的分析,进入大数据时代,我们所接触到的其实都是数据,而我们真正要做的不仅仅是将这些数据数字化,更是要将这些数字实际化。

一.大数据

1.1大数据

第一次接触到大数据是在上课的时候,网络经济学老师第一次系统的介绍了什么是大数据,在我的映像里所为大数据无非就是庞大的数据,当时一个大的含义可能是一个1t硬盘都装不下,可是当我发现真正的大数据时,我才明白自己的小和数据的大,官方上翻译道:“大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法[1])大数据的4V特点:Volume、Velocity、Variety、Veracity。”而4v其实并不能解释这个庞大的事物,就我个人简单定义而言,大数据其实就是我们通过网络来进行活动而产生的痕迹。

举个例子,当我们随意的在网络上随意的漫步的时候,我们会突然发现一个广告,而我们刚刚好需要这件东西,或者说我们刚刚看过这件东西,或者说和这个是有类似的属性的东西,那时候的你会不会惊讶你好像被监视了一样,或者说有某个人默默的关注你,其实这就是大数据。我们在浏览网页或者淘宝时,搜索我们喜欢的东西,查找我们需要的商品,其实那个时候我们已经加入到大数据的怀抱了,我们在浏览网页时会产生cookies,而这些就是那些商家所收集的数据,我们有些人会了解这种方式的痕迹,而大部分人是不知道留下的这些痕迹的,而这些痕迹显示的个人信息就是我们称其为数据,当这些数据综合汇集时,他们就变成了大数据。

1.2大数据历史

其实大数据并非新鲜事,早在1980年,著名未来学家阿尔文·托夫勒就在《第三次浪潮》一书中,将大数据热情的赞颂为“第三次浪潮”在前期,数据只是应用会计核算,随着世界的发展,数据也在不断的应用中,如跑马地,多数有经验的老板会录制一卷录像,然后细致的分析每匹马的信息,从而在下一次中更有把握的选择;同时,数据也被应用到证券市场,在美国证券市场上,大鳄们不断的分析着各种各样的数据,从而加大自己的砝码,而直到2009年前后,“大数据”才成为互联网金融的空前热门,2013年,大数据也是被推倒了高潮,随着电商行业的开始火爆,网络成为了我们当今必不可少的一件工具,它充斥着我们的世界。

1.3 大数据的的实用不足之处

当我们高谈阔论的讨论大数据时,而那些商家却是在不断的收集着各式各样的信息,不计成本的收集着各式各样的信息,可是目前的状况就是这些数据用处并不大,在我看来,大数据的问题有很多,作为一个新型的数据理论,其发展的历程也是我们需要不断的去探索的,而目前的这些问题也是我们需要去研究的。

(1)用数据的人并不知道这些大数据从哪里来,做数据的人不知道大数据怎么用,用的人不敢用,因为的数据的真实性;做的人不知道怎么用,因为大数据的复杂性,这一个问题就导致了数据量越来越大,而且越来越无法有效的使用;

(2)大数据的管理问题,作为一个数据我们不禁就想到了这些数据我们应该如何存储,而这些存储的大量数据我们又该如何的备份,每天,每时,每刻都在产生数据,而要将这些数据收集加以整理本身就是一个巨大的成本;

(3)断层问题,作为一个网络平台来说,我目前所关注的更多是关注量,点击量,转换率,而对于高管来说他们所关注的并不是仅仅的2%转换率的提高,而是我们如何更好的去收集这些信息,我们如何更好的去使用这些信息,可是当我们问及到收集后在去使用再利用时,我们又会陷入一个死循环的状态,目前只能收集的我们,没有一个完善的使用系统,导致了各个商家都是在不计成本的收集,可是他们并不知道未来这些数据要真正发挥的作用,这就是所谓的断层问题;

(4)数据的“虚假性”,当人们在日常的浏览网页或者进行购物时,其实并不是我们自己在购物,或者换一种说法来说,我们在为他人购买商品,而显示的结果就是你在进行操作,那么体现的数据还是真正的数据吗?

(5)数据的独立性,目前的数据倒数是利用电脑上网时留下的网络的痕迹,注册的客户等等来确定这个人在网络的角色,可是当我们在每次浏览后清理垃圾即清理了cookies,随着无线端的发展,手机,平板的发展让商家也越来越难以定位个人信息,信息的独立化不能连接起来,而那些“似是而非”的数据独立化并不是我们想看到的;

大数据时代才来到不久,可是时代的发展步伐是如此之快,让我们都找不到跟随的步伐,似乎一走后我们就看不到他的痕迹。数据的发展也是我们一直在追求的,而真正的做好这个数据的分析更是一个重要的环节

二.大数据的实际意义

2.1阿里巴巴与大数据

当阅读到一个阿里后台在处理数据时将客户分了18个性别的时候,我不由的偷偷的窃喜,是开玩笑的吗?可是经过调查才知道,其实这就是一种数据的分层,将一个个客户按照其购买行为将客户分为这么多的类,从而分为一个个大类。阿里从09年开始突然进入了我们的视野,在这5年里,他是收集了多少数据,才做得到定点投放数据这样高成本,高错误率的营销方式,可是我们可以预见的未来就是这样的,数据化运营需要和商业结合的非常的紧密,所以数据也是混合在商业中,阿里即运用了三板斧混,通,晒

混,阿里巴巴副总裁车品觉曾说:“你每周要和管理业务人员的负责人吃两顿饭,最起码两顿,这就是你的KPI”,这就是混,一个数据分析师你必须加入到商业活动中,那样你才能敏感的了解到市场的动态,商业敏感是要靠“混”出来的,它不会凭空的出现在你的面前,若你没有结合商业,那其实这个公司就是一个“盲人”;

通,是指将混中的数据打通,即使将商业和掌握的信息联合化,带着目标市场去分析数据,而要打通数据我们必不可少的两件事就出来了,一是掌握商业市场动态,二是我们要建立合理的系统,那样我们才能做好数据分析结合市场,做出正确的决定。

晒,其实也就是我们所要做的最后一步,在结合了上述的混与通两个步骤,我们需要将得到的结果和现实联合起来,即将数据的价值晒一晒,基于数据分析,我们定点的解决问题,根据业务的场景,结合实际,基于数据分析的结果,我们将正确的应用与当前电商时代。

而阿里巴巴,淘宝,京东等大型网站平台就是如此,他们将客户的数据收集,然后再定点投放从而增加了转换率,这不失为一个好的处理方法,而这只是数据体现的一个部分而已。

三.实践国家电网和大数据

国家电网公司是中国最大的电网企业,前身为包括全国电网和所有发电厂的原“国家电力公司”。2000年,以“厂网分离”为标志的电力体制改革开始之后,从原国家电力公司中剥离出电力传输和配电等电网业务由国家电网公司运行和经营。各发电厂由分属5大“发电集团”(大唐、国电、华电华能)运行和经营。2011年,按照国务院国有资产监督管理委员会的“主辅分离”方案,将国家电网公司中国南方电网有限责任公司省级电网和区域电网企业所属的勘测设计、火电施工、水电施工和修造企业等辅业单位剥离建制,与4家中央电力设计施工企业重组为两家新公司。国家电网公司和中国南方电网有限责任公司在北京市、天津市和山西省等15个省、自治区和直辖市公司所属辅业单位和中国葛洲坝集团公司以及中国电力工程顾问集团公司重新组建为中国能源建设集团有限公司。国家电网公司作为关系国家能源安全和国民经济命脉的国有重要骨干企业,以投资、建设和运行运营电网为核心业务,为经济社会发展提供坚强的智能电网保障。经营区域覆盖全国26个省、自治区和直辖市,覆盖国土面积的88%。

在政府机构中我们团队将历年来26个省的信息收集,利用spider技术,从其庞大的数据库中爬出来数据,将其存储于一个数据库中,再将其分层化,按不同的类目分析,在一级分层后,再在一级分层的基础上进行二级分层,从而将数据划分为一个短语,100个类的集合体,利用echart 软件将数据和中国地图相结合,从而体现一个系统的信息流,而对于信息的更新,我们更是将系统和数据库建立映射效果,在以后的时间里,数据即形成了一体化的可循环效果。

结论

大数据时代已经来临,我们正处历史的转折点,数据技术在快速的改革,大数据也成了人们竞相议论的话题,我们需要在数据这个时代用数据找机会,寻找到有用的数据,它决定着未来的商业,也是我们即将步入的时代------大数据时代!

参考文献和注释

1.(美)施瓦尔贝(Schwalbe,K.)著. 王金玉等译. IT项目管理[M]. 北京:机械工业出版社. 2001-12.

2.美国项目管理协会著. 卢有杰, 王勇译. 项目管理知识体系指南[M]. 北京:电子工业出版社. 2005-01.

3.大数据时代:生活、工作与思维的大变革-2012年12月15日维克托迈尔-舍恩伯格 (Viktor Mayer-Schönberger)

4. 数据之巅:大数据革命,历史、现实与未来-2014年5月16日涂子

5.大数据时代-车品觉

南京财经大学

大数据时代的信息分析报告

姓名:刘 波

班级:电子商务1201

本文来源:https://www.2haoxitong.net/k/doc/c124684bbcd126fff6050b11.html

《big data.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式