大数据分析心得体会

发布时间:2019-02-10 15:51:22   来源:文档文库   
字号:

大数据分析心得体会

【篇一:大数据心得体会】

大数据心得体会

早在2007年,人类制造的信息量有史以来第一次在理论上超过可用存储空间总量,近几年两者的剪刀差越来越大。2010年,全球数字规模首次达到了“zb”1zb1024tb)级别。2012年,淘宝网每天在线商品数超过8亿件。2013年底,中国手机网民超过6亿户。随着互联网、移动互联网、传感器、物联网、社交网站、云计算等的兴起,我们这个社会的几乎所有方面都已数字化,产生了大量新型、实时的数据。无疑,我们已身处在大数据的海洋。 有两个重要的趋势使得目前的这个时代(大数据时代)与之前有显著的差别:其一,社会生活的广泛数字化,其产生数据的规模、复杂性及速度都已远远超过此前的任何时代;其二,人类的数据分析技术和工艺使得各机构、组织和企业能够以从前无法达到的复杂度、速度和精准度从庞杂的数据中获得史无前例的洞察力和预见性。

大数据是技术进步的产物,而其中的关键是云技术的进步。在云技术中,虚拟化技术乃最基本、最核心的组成部份。计算虚拟化、存储虚拟化和网络虚拟化技术,使得大数据在数据存储、挖掘、分析和应用分享等方面不仅在技术上可行,在经济上也可接受。

在人类文明史上,人类一直执着探索我们处的世界以及人类自身,一直试图测量、计量这个世界以及人类自身,试图找到隐藏其中的深刻关联、运行规律及终极答案。大数据以其人类史上从未有过的庞大容量、极大的复杂性、快速的生产及经济可得性,使人类第一次试图从总体而非样本,从混杂性而非精确性,从相关关系而非因果关系来测量、计量我们这个世界。人类的思维方式、行为方式及社会生活的诸多形态(当然包括商业活动)正在开始发生新的变化。或许是一场革命性、颠覆性的变化。从这个意义上讲,大数据不仅是一场技术运动,更是一次哲学创新。

1 大数据的概述

1.1 大数据的概念

大数据(big data)是指那些超过传统数据库系统处理能力的数据。它的数据规模和转输速度要求很高,或者其结构不适合原本的数据库系统。为了获取大数据中的价值,我们必须选择另一种方式来处理它。

数据中隐藏着有价值的模式和信息,在以往需要相当的时间和成本才能提取这些信息。如沃尔玛或谷歌这类领先企业都要付高昂的代价才能从大数据中挖掘信息。而当今的各种资源,如硬件、云架构和开源软件使得大数据的处理更为方便和廉价。即使是在车库中创业的公司也可以用较低的价格租用云服务时间了。

对于企业组织来讲,大数据的价值体现在两个方面:分析使用和二次开发。对大数据进行分析能揭示隐藏其中的信息,例如零售业中对门店销售、地理和社会信息的分析能提升对客户的理解。对大数据的二次开发则是那些成功的网络公司的长项。例如facebook通过结合大量用户信息,定制出高度个性化的用户体验,并创造出一种新的广告模式。这种通过大数据创造出新产品和服务的商业行为并非巧合,谷歌、雅虎、亚马逊和facebook,它们都是大数据时代的创新者。

1.2 大数据的三层关系

第一层关系:数据与机器的关系。大数据纪元刚开始,产业界碰到的第一个核心问题就是的问题。做了几十年的数据仓库甚至海量并行处理的数据库都不能处理那么大的数据,怎么办?需要范式切换。主要有三个方面,新型的数据与机器关系当中的第一条就是重新考虑架构与算法,重新考虑舍得,有舍才能得,天下没有免费的午餐,所以必须要舍弃一些,得到一些新的。必须舍弃贵族化的高端小型机和unix服务器,得到平民化的更大量的x86服务器。通过这样一种可横向、可水平扩展服务器处理每两年翻番的数据量的挑战。第二个舍得是舍弃硬件的可靠性和可用性,得到软件的可靠性和可用性。这也就是谷歌三大论文以及hadoop的核心重点。第三个舍得是舍弃传统数据库的强一致性,获得更放松一致性、可扩展架构,如nosql。第四个舍得是传统算法强调非常严格的精确性,现在要放弃一些精确性,通过近似、采样这种方式来获得更好的扩展性。

最早大数据的处理范式是mapreduce的批量处理,英特尔慢慢有其他的需求,实时的流处理、多迭代的处理、图计算、即时查询等等新的范式百花齐放,最后万法归宗。刚才王斌老师将讲的saphana本身就是数据管理和分析的融合,现在非常流行的hadoop之后的spark,就是把前面的各种范式进行了融合。

存储与内存的消长,大数据第一个要解决把数据存储下来,后来发现要把它放到大的内存里进行处理,获得实时性,接着在存储和内存之间现在又出现了闪存,有闪存化甚至全闪存的存储,也有闪存化的内存,把所有的计算在闪存里面处理,已经被微软、facebook等等大量使用。大家可以预期,两年以后出现新的非易失性的闪存,它的速度可能要比闪存快几百倍,和内存相似,这又会极大地颠覆数据与机器的关系。

第二层关系:数据与人的关系。主要是价值的觉醒,如果数据不能产生价值它可能是负面资产。数据怎么能够给人带来价值?我们介绍一下它的价值维度,把它映射到二维的时空象限里,用六个关键词来描述它。第一是“volume”,两个关键词,小数据见微对个人进行刻划,大数据知著能够了解宏观规律,它是空间概念,同时也是时间概念,数据刚刚产生的时候,它的个性化价值、见微的价值最大,而随着时间的推移,它渐渐退化到只有集合价值。第二是velocity,时间轴的原点是当下实时价值,副轴是过往,正轴是预测未来,如果知道知前后就能够做到万物的皆明。第三是variety,多源异质的数据,能够过滤噪声、查漏补缺、去伪存真,就是辩讹。还有晓意,能够从大量的非结构化数据中获得语意,从而能够使机器窥探人的思维境界,这六个价值维度怎么去实现?主要是两部分人,一是数据科学家要洞察数据,另外一个是终端用户和领域专家要去解读数据并利用数据。首先看洞察数据,数据科学,人和机器作用发生了消长,讲个例子,机器学习大家觉得是机器的问题,其实人在里面起到很重要的作用,尤其是机器学习是模型加特征,而特征工程是一个人力工程,你要有经验非常丰富的特征团队去死磕特征,找出更好、更多的特征,才能够使机器学习的效果更好。但是现在深度学习这些新技术出来,能够用机器学习特征,能够在大量非结构化数据中找到丰富的信息维度用特征表达出来,这远远超出了人的能力。大家知道黑客帝国描述了一个场景,人脑袋后面插一个插头,给机器提供营养,我可能不会那么悲观,但是像这样的互动关系以一种更良性的方式出现了,现在人的一言一行、社交行为、金融行为都已经成为机器的养料、机器的数据,使得机器获得更好的洞察。

终端用户需要更好地、更傻瓜化的分析工具和可视化工具,两年前我去参加大数据的会,基本上都是hadoopnosql现在大家参加大数据会可以看到清一色的分析工具和可视化工具。大数据跟各行各业的化学作用正在发生。如果

马化腾说互联网+”是互联网与各行各业的加法效应,那么大数据将与各行各业产生乘法效应。

互联网能发展起来经济学理论和实践是很重要的支撑,梅特卡夫定律决定了一个互联网公司的价值,跟它用户数的平方成正比,又比如说谷歌请最好的经济学家,它的一个广告业务的核心就是建立在一个非常先进的拍卖经济学的模型基础上。数据经济也需要这样一些基础的理论,比如数据定价和信息定价不一样,信息做一个咨询报告5000美金卖给你,可以卖给所有人。但数据对不同的单位价值不一样,可能我之毒药是彼之蜜糖。另外估值,一个企业拥有大量的数据,是无形资产的一部分,对于企业的市场价值带来了多大的增长。

1.3 大数据的四个特性

大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。这也是一个描述性的定义,在对数据描述的基础上加入了处理此类数据的一些特征,用这些特征来描述大数据。当前,较为统一的认识是大数据有四个基本特征: 数据规模大

( volume) ,数据种类多( variety) ,数据要求处理速度快( velocity) ,数据价值密度低( value) ,即所谓的四v 特性。

数据规模大( volume):企业面临着数据量的大规模增长。例如,idc最近的报告预测称,到2020年,全球数据量将扩大50倍。目前,大数据的规模尚是一个不断变化的指标,单一数据集的规模范围从几十tb到数pb不等。简而言之,存储1pb数据将需要两万台配备50gb硬盘的个人电脑。此外,各种意想不到的来源都能产生数据。

数据种类多( variety):一个普遍观点认为,人们使用互联网搜索是形成数据多样性的主要原因,这一看法部分正确。然而,数据多样性的增加主要是由于新型多结构数据,以及包括网络日志、社交媒体、互联网搜索、手机通话记录及传感器网络等数据类型造成。其中,部分传感器安装在火车、汽车和飞机上,每个传感器都增加了数据的多样性。

处理速度快( velocity):高速描述的是数据被创建和移动的速度。在高速网络时代,通过基于实现软件性能优化的高速电脑处理器和服务器,创建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、分析并返回给用户,以满足他们的实时需求。根据ims research关于数据创建速度的调查,据预测,到2020年全球将拥有220亿部互联网连接设备。

数据价值密度低( value):大数据具有多层结构,这意味着大数据会呈现出多变的形式和类型。相较传统的业务数据,大数据存在不规则和模糊不清的特性,造成很难甚至无法使用传统的应用软件进行分析。传统业务数据随时间演变已拥有标准的格式,能够被标准的商务智能软件识别。目前,企业面临的挑战是处理并从各种形式呈现的复杂数据中挖掘价值。

1.4 大数据的三个特征

除了有四个特性之外,大数据时代的数据还呈现出其他三个特征。

第一个特征是数据类型繁多。包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求.

第二个特征是数据价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值提纯,是大数据时代亟待解决的难题。

【篇二:大数据心得】

大数据讲座学习心得

在前几年本世纪初的时候,世界都称本世纪为信息世纪。确实在计算机技术与互联网

技术的飞速发展过后,我们面临了一个每天都可以信息爆炸的时代。打开电视,打开电

脑,甚至是在街上打开手机、pda、平板电脑等等,你都可以接收到来自互联网从世界各地上

传的各类信息:数据、视频、图片、音频??这样各类大量的数据累积之后达到了引起量变

的临界值,数据本身有潜在的价值,但价值比较分散;数据高速产生,需高速处理。大数据意

味着包括交易和交互数据集在内的所有数据集,其规模或复杂程度超出了常用技术按照合理

的成本和时限捕捉、管理及处理这些数据集的能力。遂有了大数据技术的应运而生。 现在,当数据的积累量足够大的时候到来时,量变引起了质变。大数据通过对海量数

据有针对性的分析,赋予了互联网智商,这使得互联网的作用,从简单的数据交流和信息

传递,上升到基于海量数据的分析,一句话他开始思考了。简言之,大数据就是将碎片化

的海量数据在一定的时间内完成筛选、分析,并整理成为有用的资讯,帮助用户完成决策。

借助大数据企业的决策者可以迅速感知市场需求变化,从而促使他们作出对企业更有利的决

策,使得这些企业拥有更强的创新力和竞争力。这是继云计算、物联网之后it产业又一次颠

覆性的技术变革,对国家治理模式、对企业的决策、组织和业务流程、对个人生活方式都将

产生巨大的影响。后工业社会时代,随着新兴技术的发展与互联网底层技术的革新,数据正

在呈指数级增长,所有数据的产生形式,都是数字化。如何收集、管理和分析海量数据对于

企业从事的一切商业活动都显得尤为重要。大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、

制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的竞争中摆脱受制于人

的弱势境地,才能把握发展的方向。了解了大数据之后我们也该了解它所具有的巨大价值。就目前来说大数

的来源主要还是互联网,来自互联网上的大多数不被重视信息都是具有巨大开发价值的,其具有巨的商业价值,我们所缺少的只是一些数据分析等手段。例如:在如今,

网购已经成为了一种风潮,网上也涌现了以淘宝、京东、亚马逊等一系列的购物网站。而在

这些网站之中,顾客的浏览记录,购买记录等等都是一些巨大商业价值的信息。借鉴塔吉

的先例,我们可以利用大数据技术收集分析,就可预测需求、供给和顾客习惯等,

做到精准采购、精准投放,达到利益放大的效果。 从全球范围来看,很多人都把2012年看

做是大数据时代的元年。在这一年里,很多行业在大数据方面的管理、规划和应用已经觉醒。

电商、金融、电信等行业数据有着长期的数据积累。事实上,很多互联网公司,例如亚马逊、

google、腾讯,更愿意将自己定位为数据企业。因为信息时代,数据成为经营决策的强有力

依据,给企业带来了发展和引领行业的机遇。银行也同样拥有丰富的数据矿藏,不仅存储处

理了大量结构化的账务数据,而且随着银行渠道快速渗透到社交网络、移动端等媒介,海量

的非结构化数据也在等待被收集和分析。未来的金融业将更多地受到科技创新力的驱动,也

越来越倾向于零售营销:对于金融业来说,大数据意味着巨大的商机,可强化客户体验,提

高客户忠诚度。大数据技术的发展带来企业经营决策模式的转变,驱动着行业变革,衍生出

新的商机和发展契机。驾驭大数据的能力已被证实为领军企业的核心竞争力,这种能力能够

帮助企业打破数据边界,绘制企业运营全景视图,做出最优的商业决策和发展战略。金融行

业在大数据浪潮中,要以大数据平台建设为基础,夯实大数据的收集、存储、处理能力;重

点推进大数据人才的梯队建设,打造专业、高效、灵活的大数据分析团队;不断提升企业智

商,挖掘海量数据的商业价值,从而在数据新浪潮的变革中拔得头筹,赢得先机 在如此快速的到来的大数据革命时代,我们还有很多知识需要学习,许多思维需要转变,

许多技术需要研究。职业规划中,也需充分考虑到大数据对于自身职业的未来发展所带来的

机遇和挑战。当我们掌握大量数据,需要考虑有多少数字化的数据,又有哪些可以通过大数

据的分析处理而带来有价值的用途?在大数据时代制胜的良药也许是创新的点子,也许可以

利用外部的数据,通过多维化、多层面的分析给我们日后创业带来价值。借力,顺势,合作

共赢。把自己的心门打开,像海绵般吸取积极、正能量的东西。篇二:大数据时代书面记录

与心得体会

大数据时代书面记录与心得体会2015512日,听取了大数据时代相关技术的技术讲座。 当今,大数据的到来,已

经成为现实生活中无法逃避的挑战。每当我们要做出决策的时候,大数据就无处不在。大数

据术语广泛地出现也使得人们渐渐明白了它的重要性。大数据渐渐向人们展现了它为学术、

工业和政府带来的巨大机遇。与此同时,大数据也向参与的各方提出了巨大的挑战。大数据,其影响除了经济方面的,它同时也能在政治、文化等方面产生深远的影响,大

数据可以帮助人们开启循管理的模式,也是我们当下大社会的集中体现,三分技

术,七分数据,得数据者得天下。大数据的影响,增加了对信息管理专家的需求。事实上,

大数据的影响并不仅仅限于信息通信产业,而是正在吞噬和重构很多传统行业,广泛运

用数据分析手段管理和优化运营的公司其实质都是一个数据公司。麦当劳、肯德基以及苹果

公司等旗舰专卖店的位置都是建立在数据分析基础之上的精准选址。而在零售业中,数据分

析的技术与手段更是得到广泛的应用,传统企业如沃尔玛通过数据挖掘重塑并优化供应链,

新崛起的电商如卓越亚马逊、淘宝等则通过对海量数据的掌握和分析,为用户提供更加专业

化和个性化的服务。大数据在个人隐私的方面,大量数据经常含有一些详细的潜在的能够展

示有关我们的信息,逐渐引起了我们对个人隐私的担忧。一些处理大数据公司需要认真的对

待这个问题。例如美国天睿资讯给人留下比较深刻印象的是他的一个科学家提出,我们不应

该简单地服从法律方面的隐私保护问题,这些远远不够的,公司都应该遵从谷歌不作恶的原则,甚至更

应该做出更积极的努力。

《大数据时代》读后感

一、学习总结

1、关于作者

2、关于大数据

1)大数据是什么

大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主

流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目

的的资讯。大数据的4v特点:volume(大量)、velocity((高)速率)、variety(多样性)、

veracity(真实)。大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。

2)大数据的来源

所谓的“big data”是由ibmgartner分析师提出的概念,我们比较时髦的称其为大

数据。

3)大数据现状、应用通过分析和优化企业数据实现一种对未来的企业运营的精准的预测能力。采用一系列的

技术,从技术中获得洞察力,也就是bi或者分析;另外一个是分析路径,寻找关键绩效指标,

从仪表盘这样的工具进行数据分析,实现预测性工作。

4)大数据未来

fayyad曾被视为数据挖掘领域的no.1,他用下图向我们解释了为什么说分析是大数据未

来的发展方向。

3、关于大数据时代

1)思维变革

? 更多:不是随机样本,而是全体数据;样本=总体? 更杂:不是精确性,而是混杂性;允许不精确,最大化利用全体数据。? 更好:不是因果关系,而是相关关系;是什么,而不是为什么

2)商业变革

? 数据化:一切皆可量化;关注信息本身。 ? 价值:发现、利用数据的价值。 ? 角色定位:大数据掌控、大数据技术、大数据思维的三足鼎立。

3)管理变革

? 责任:数据来源有效性、数据存储安全性、数据使用合法性。 ? 自由:反对数据垄断大亨。

二、读后感

1、大数据时代,是名符其实的信息社会经历了口口相传、纸媒传播,到现在的网络技术,我们可以获得比以前更多的信息并进

行分析,可以从更多的维度诠释世界。 通讯技术的发展,促进了个人/组织在信息获取上的平等发展,数据不再是限制我们努力

的因素了。数据的的爆炸式产生,促使我们必须从海量的信息中做出选择、掌握数据挖掘技

术和筛选工具。

2、大数据技术支持预测工作大数据的4v特点,及对相对关系的发掘,改变了传统的基于少量样本的预测思维。思维

的转变,将会在各行各业中爆发出更多的预测技术和工具,进而支撑预测工作的大力发展。大数据技术越完善,我们越能更快更全面的获得更多的有效数据,预测则越准确。

3、知识管理迫在眉睫大数据的未来是数据分析,而分析的目的是转化为经验、规律、总结??,它们的集合就

是知识。知识是个人/组织成长的直接推动因素。 知识管理要遵循积累原则(知识积累是实施知识的管理基础)、共享原则(一个组织内部

的信息和知识要尽可能公开,使每一个员工都能接触和使用公司的知识和信息)、交流原则(知

识管理的核心就是要在公司内部建立一个有利于交流的组织结构和文化气氛,使员工之间的

交流毫无障碍)。这三原则不正是大数据技术的组织基础吗?

三、在工作中的而应用

1、关注运作工作向数据管理方向的转化 在仓储工作中,为物品对象(仓库、货物、设备、员工等)、流程对象(如作业、异常处

理、管理等)建立属性列表,关注数据积累。 同时,关注仓储数据与运输、客服、园区等各方面环境数据的对应。

2、重视数据挖掘,提高数据分析能力 根据运作问题和目标,通过数据挖掘和分析,寻找有效的数据指标。通过对关键指标的

趋势预测,发现潜在风险、发掘改善途径。

3、推动数据转化,促进建立知识管理系统在实际工作中,重视对裸数据、经验、执行文件的管理,引导各项目的知识转化。建立

从数据积累、知识转化(数据到知识、隐性知识到显性知识、个体知识到组织知识等)、知识

共享的知识管理体系,形成仓储管理知识体系及其良性循环。 (正文结束)篇四:大数据心得体会

大数据时代的信息分析平

台搭建安装报告

一、 平台搭建

描述小组在完成平台安装时候遇到的问题以及如何解决这些问题的,要求截图加文字描

述。 问题一:在决定选择网站绑定时,当时未找到网站绑定的地方。解决办法:之后小组讨

论后,最终找到网站绑定的地方,点击后解决了这个问题。 问题二:当时未找到tcp/ip属性这一栏 解决办法:当时未找到tcp/ip属性这一栏,通过老师的帮助和指导,顺利的点击找到了

该属性途径,启用了这一属性,完成了这一步的安装步骤。 问题三:在数据库这一栏中,当时未找到“foodmartsaledw”这个文件 解决办法:在数据库这一栏中,当时未找到“foodmartsaledw”这个文件,后来询问老

师后,得知该文件在第三周的文件里,所以很快的找到了该文件,顺利的进行了下一步 问题四:在此处的sql server的导入和导出向导,这个过程非常的长。 解决办法:在此处的sql server的导入和导出向导,这个过程非常的长,当时一直延迟

到了下课的时间,小组成员经讨论,怀疑是否是电脑不兼容或其他问题,后来经问老师,老

师说此处的加载这样长的时间是正常的,直到下课后,我们将电脑一直开着到寝室直到软件

安装完为止。

问题五:问题二:.不知道维度等概念,不知道怎么设置表间关系的数据源。关系方向不

对解决办法:百度维度概念,设置好维度表和事实表之间的关系,关系有时候是反的——

点击反向,最后成功得到设置好表间关系后的数据源视图。(如图所示) 这个大图当时完全不知道怎么做,后来问的老师,老师边讲边帮我们操作完成的。 篇五:大数据时代读书心得 一部似乎还没有写完的书

——读《大数据时代》有感及所思 读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要

彻底改变哪些思维和操作方式,但显然作者想要终结或颠覆一些传统上作为我们思维和

生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。

小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“

着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。书中几乎肯定要

颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话量子物理学的理

论已经脱离实际终结量子力学。对此我很高兴,因为统计学和量子力学都是我在大

学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我

不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要

颠覆它们的论点,毕竟还是在前面加上了很可能认为这样的保护伞。 近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是

要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,

否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是通往未来的必然改

,那我就必须不受限于传统的思维模式和特定领域里隐含的固有偏见,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它

们。

当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,

再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。

但是由统计学和量子力学以及其他很多我们也很可能认为我们不再需要的理论上溯,它

们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起

不再需要的话,就让我很担心了! 《大数据时代》第16大数据的核心就是预测。逻辑是——描述时空信息

之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的

是因果关系,而是相关关系知道是什么就够了,没必要知道为什么,而逻辑学四大基本

定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又明确规定任何事物都

有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果

关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定

掉其中之一。这就是让我很担心的原因。 可我却不能拭目以待,像旁观者一样等着哪一个脱颖而出,因为我身处其中。问题不

解决,我就没法思考和工作,自然就没法活了! 更何况还有两个更可怕的事情。其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量 和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,

再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马

上造成那可怕的时间旅行机器。唯一阻止那些爱因斯坦瞎胡闹的就是因果关系,

因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后

反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心最后

做出决策的将是机器而不是人。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的

机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。 还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面

一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法

睡着觉。自己解决不了就只能依靠专家来指点迷津。 所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个

第四部分——大数据时代的逻辑思维。

【篇三:《大数据》读后心得体会】

首先,本书大体上都是在讲美国政府在各社会团体不断争取权利、三权分立制度的制衡下,一步步将信息公然的历程。和数据对美国政治所产生的影响,美国政府如何保护公民隐私等等。实在真正触及到企业如何变得更加智能,惟有第四章讲得非常具体。先来看一下完全的商务智能流程:1、通过各种来源的关系型数据库,使用elt(提取、转换、加载)工具,对来自不同系统的数据以同一格式进行清洗、转换、集成进进到数据仓库。2、锁定目标数据落后行联机分析。通过不同的分析角度进行***分析,这样用户可以随时创建自己需要的报表,开发职员只要在后台为用户创建构建***的数据立方体模型,用户就能够直接在前真个各个维度之间进行切换,从不同的维度对数据进行分析。从而取得更加全面的、动态的的分析结果。

3、进行数据发掘。就是从海量数据中,发掘出具有价值的数据。通过对数据的发掘其一、可以发现数据的历史规律,对过往进行总结。其二、可以根据数据对未来进行猜测。企业可以根据猜测对未来行情趋势做出预判,并作出相干决策。4、数据可视化,我想任何人看到一推数据,就会感到很头疼。固然也很不直观,到底企业的各项指标相比往年是好是坏往做对照也会很麻烦。使用各种图表、三维地图、动态摹拟和相干的动画技术是本来枯燥乏味的数据,变得生动起来。数据可视化把数据以更加直观的形态展现出来,令人们对相干数据做到一目了然。5、通过上面几步我们就把本来毫无价值的数据,变成了信息,最后演化为知识。其次,我们北京大学青鸟公司应当斟酌的:1、是不是有必要建立数据仓库?固然我这个题目我也在线上向ibm数据仓库的职员询问过。要斟酌的有两个因素:其一、数据量的级别,其二、对数据发掘的程度。一、数据量。收集器实时都对新闻、论坛、博客、微博在进行收集,固然假如说一年的数据量不算大的话,亦或宁波本地的数据量也没那末大的话。公司假定几年后、几十年后业务量增大了,做到了浙江省乃至全国的时候。那个时候的数据量我想应当是非常的庞大了。二、对数据发掘的程度,固然有关公司触及的更多。不过有时候那些公司做得仅仅是从收集的数据那里通过筛选,将相干信息发送给相干的客户。个人觉得这个价值应当被放大,通过对相干数据的发掘对过往的规律进行总结,对未来的趋势做出猜测。如固特异轮胎,根据往年的数据总结出某款轮胎某地和在哪一个时间段销量最大,然后第二年可以根据这个数据,制造商可以提早对该型号轮胎进行大量备货以备不时之需。通过发掘在特定的时间段,哪几种商品***销售会得到更好的销量等等。固然数据仓库是面向主题的数据集合,用于支持管理中的决策制定。个人觉得对公司领导层做出正确决策有很大的指导作用。2、公司应当加大数据发掘能力。公司在招聘往里面招聘的所谓数据分析师,只不过是用来数据监测的。真正意义上面的数据分析师很是匮乏。现在客户大多希看的是能够给本企业决策有指导性意义的报告、或建议。这就需要我们通过数据发掘猜测出未来趋势,即猜测性分析。这样不管在产品推广,和在本品牌虔诚度上都会有一定的保障。3、是不是能通过联机分析处理将数据从各个角度、不同纬度展现出来。例如对销售数据的分析,时间周期是一个维度,产品种别、分销渠道、地理散布、客户群类也分别是一个维度。一旦***数据模型建立完成,用户可以快速地从各个分析角度获得数据,也能动态的在各个角度之间切换或进行多角度综合分析。4、数据可视化设计上需要强化。相干系统是直接给客户进行操纵使用的,但我们所生成报告里面的统计图、走势图还不能很直观的展现给客户。这个对客户体验来讲是非常致命的,由于一旦不能直观的体现数据所显现出来的状态,客户就不能对其决策做出正确的判定。进一步致使客户对我们虔诚度的下降。

本文来源:https://www.2haoxitong.net/k/doc/ea4864410408763231126edb6f1aff00bfd570df.html

《大数据分析心得体会.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式