大数据的“大”指的是什么Yw

发布时间:2016-07-02 12:03:34   来源:文档文库   
字号:

大数据的指的是什么

余效诚

最近几年,流行语言中出现了大数据、云计算、自媒体、流媒体等等新词,不少学者、业界精英也在以个人的不同的学术背景和见解进行各种解读。但是由于大家都是从自己视角兴趣去解读,没有尝试从根本上阐述实质,难免偏于一隅,顾此失彼、挂一漏万,也难以自圆其说。最多只是描述了一些复杂的现象,强调了变化的多重纷繁,记录了对社会文化颠覆性的深切影响,甚至分析了对某个领域的痛彻侵扰,但多是从现象到现象,从传播现象到经济现象,从媒体现象再到历史现象,总结现象多于阐述实质,归纳变化多于分析机理,总结问题多于归纳原理,都难以从根本上说清楚现象的实质。其实有些业内人物不甘寂寞,解释得很个性,远远超出了这几个字本来的意义,任意增加字义本来没有的意思反而搅乱了学术语言本来的表达逻辑体系。根据本人的观察、实践、分析与判断,这些词语实际上分别从不同角度真实清晰地描述了一种新的媒体现象,的确说清了一些事情,但是也模糊了一些事情,作为新闻词汇存在,无可厚非,但说作为学理界定确实是勉为其难。我们不得不寻找问题源头的线索,寻找更新、更准确的说法来表达我们的看法和观点。

一、先看看大家说清楚了什么

究竟什么是数据,可以先从已经说清了的这部分内容看。应该是中心词,是修饰数据的。数据我们知道,“数据”说的是数字语言,可以将任何事物以一种二进制语言代码方式记录、加工、存储和传播,而随机形成的数字化的计算机程序,这应该是比较简单清楚的解释,虽然它很专业。但是这个字本来通俗好懂,但是现在这个,解释起来却犯难了。到底有多大,大到了什么程度,大了又如何?云计算的云、自媒体的自、流媒体的流,都是读起来简单,看起来很神秘,说起来很复杂,想起来没有任何头绪,基本属于类似情况。

人们已经清楚的是,数据已经越来越大,大到了难以描述、难以解释、难以说明的地步。最早的计算机内存量单位,KBMBGB已经不够用,如今普通“家庭电脑内存都已经用到了TB。手机内存都达到了接近上百GB。大数据究竟是什么?是什么意思。应该不是单纯的数据量的大小。在这里,我们不得不从根本上首先,界定好当今社会文化数字多媒体网络移动便携媒体--------智能手机,究竟给人类带来了什么说起。本人认为,数字化社会文化时代的智能手机,这个移动电话与平板电脑合并起来的物件,带来了全社会公众学习与信息传播效率反馈模式的变革,信息传输效率反馈模式从迟滞型变成了即时型。这恐怕是唯一能够给所有疑问找到解释的最根本的思路,这才是思考问题思路的源头。一切都源于公众信息传输反馈模式的变革,迟滞型是因为纸张和人不能进行信息互动,而智能手机融合了计算机网络的功能,计算机网络有什么功能,大家都清楚,即对信息进行搜索、加工、存储、发布等。这些功能是纸张等平面媒介无法实现,纸张根本不具备的。因此,这既需要我们从宏观上,认识媒体变化的社会经济学意义;又需要我们微观上接受阅读行为学上的新文化的到来。社会学意义带来的是社会新型产业的经济现象的冲击,阅读行为学意义的变化带来的是新型信息消费行为的变化。两种变革同时冲击社会各个层面,这就是大数据的、云计算的、自媒体的,以及流媒体的,所隐含的实际价值所在。不同的是强调了影响范围的复杂,强调了影响层次多面的复杂,强调了影响方向的复杂,强调了影响形式的复杂,角度不同,指向统一。

具体说,这几个字说清楚了的事情:

1.“的意思是,所有的行业范围都难以逃脱数字化文化这个新时代媒体的影响,而且影响将是全面深刻的,甚至很多行业可能是颠覆性的。类似重新洗牌、重新建立经济生态系统一样。主要内容是关于信息的存在形式,比如新闻出版业,媒介融合了,报社电台如何重新界定各自市场社会功能;学校,教材录像、成绩测试,全都上网了,教育不改变观念,不调整制度,老师还怎么干,考试怎么办;大量新知识每分每秒都有人在网上发布,版权如何界定;任何人都可以发布信息传播知识,国家考核如何规范;金融财务信息可以在无线虚拟空间流动了,资金安全问题如何解决,大家都知道,就像空气是无法隔离的一样,虚拟网络如何建立安全流动屏障。大数据带来了所有行业的业态存在方式的逻辑基础革命。涉及行业太多,难以区别计数,于是就成了人们唯一为这个视觉无法辨认的二进制语言找到的描述方式。其实这里涉及几种数据,从生成时间上看有自动生成的数据、有人为活动生成的数据,这些数据和人的活动有关;从数据社会价值看,有即时产生价值的数据,有加工后才能产生价值的数据;从生成数据的过程看,有对国家政策敏感的数据,也有间接敏感的数据和不太敏感的数据。人们正在利用人为地理解活动牵动国家的政策影响更多的数据,建立起更多的敏感机制,朝着更多生成社会价值的方向流动。

2.“的意思是,所有行业都将在全新的产业层面中重新界定自己的位置,寻找自己的商业模式、效益来源,建立自己的供销通道,形成那个属于自己的价值链关联,进入相关的产业链,这些产业链之间常常可以划分为很多个层次复杂交错的业务关系。天空的云是多变的水蒸气团,边际、密度、形状都难以界定描述。二者似乎很相似。但是好在深究起来,我们敢断定:数字读物时代信息预制代理产业化发展应该是云的实质意义。不同的是产业门类除了延续传统产业门类,还要兼顾数据传播、数据生产、数据存储、数据加工等建立相应的规范概念。在这个意义上它很像天上的云,各个行业各个门类产品难以想象界定,比如随时发生的信息知识化产业、已经发生的信息的规范产业、甚至即将发生的信息知识产业;个人整理发布的信息,使用提取存储加工,发布传输;团体采集、加工存储发布的信息,无论大小多少还是轻重缓急等等都和云彩有相像的特征。其实,云计算重在计算,计算机的计算具体说是包括了统计、分类、筛选、匹配等自动计算,以及人媒实时互动、加工、控制、传输等被动计算。正是这些计算互联网才能有公共服务,才有的各种平台,才有的各种交易活动,以及娱乐体验活动。

3.“的意思是,所有接受信息的人同时也可以是传播信息的人,信息传递的方向发生了双向同时传递的新的历史性变化。注意,这里有两个语言表达上的歧义现象:一个人怎么可以接受信息的同时还能发布信息呢。其实这里讨论的不是动作性现象,而是权利归属性现象,实际上的意思是,每个人都可以同时拥有接受信息和发布信息的权利。此其一。其二,自媒体说起来好像每个人只要有个智能手机,就可以成为报纸电视工作者了。那怎么可能呢。那种没有编辑思想,个人宣泄性文字,一旦灌涌入人们的手机,大家喜欢看才怪。说成实际代表了人们的一种面对历史性变化的迷茫,其实任何人接受信息的时刻都不可能同时发布信息,這里描述的只是一种社会权利的重新整合过程,过去有权发布信息的永远只是少数人,如今变成了社会成员全体。对于如何发布信息大多数人太生疏了,完全不知所措,因此自媒体一词显得格外神秘,其实所有熟悉新闻工作的人知道,这个东西只是带来了工作的方便,并无什么神秘的。对于不熟悉新闻工作的普通人来说即使是大明星、著名作家、甚至是科学家也难以理解,自媒体究竟干什么用,怎么用。所有人都具有了发布信息的本事,新闻工作怎么做,这只是一个假设,新闻永远会有。也必须存在。只是存在方式不同而已。

4.“的意思是,文字必须和视频等其他语言形式共同流动变成了未来人类语言的存在形式。技术上,物理问题一般不应该成为问题,关键还是概念上,人们必须接受这样一个未来,人类的媒介语言将要从单纯的静态符号转变成静态符号加动态视频以及声音图片形成多媒体语言,难办的是人类还远没能从语言学理论上接受这个现实。

以上概括可能是迄今所有论述中最全面、精炼的,所有当初这些词语的发明人可能都无法这么精准的提炼。顺便再说一句新媒体,在人们讨论传统媒体即将灭亡的时候,最开始灭亡的是新媒体。可见究竟什么新媒体是一个伪命题。

二、 再看哪些事情还没有说清楚

1.智能手机带来了公众信息预制代理的产业化发展的历史机遇。

如今,人们上网,无论是通过座机上网,还是无线上网,都会非常方便地查找到需要的各种信息,但是从来没有人问问,这些信息是从哪发来的。因为大家知道:这是很多人在网上写东西,发东西,时间一久,信息留在网络上,越积越多,从而方便了公众查阅传输。大数据的在这里包含了至少两重意思,一是,信息来自网络上的无数作者,这些传输、传播者渗透在各行各业,构成了虚拟的世界空间,正在从那里回头改变了人们在现实的生存方式;二是计算机的点击功能使我们可以实现各种检索、链接,通过这些活动人们可以看到所希望看到的几乎一切。说到这,内行人可能立即想到,传输信息的人恐怕不仅是个体的信息处理者,更多的是企业或各类组织;立即想到:传输的信息肯定有各种类型的,各类、各行业企业经营性的商品信息,政府机构、协会组织构成的活动的信息,以及各种人的生活、娱乐、体验性的信息等等。每个人都可以是信息的传输者,每个人又都是这些信息的接受者,而且每一次链接都有无数链接计算产生,这正是大数据最初级的表现。也正是本文所述公众信息预制代理产业化的意思。之后,随着时间的推移,人们对各个行业的信息预制有了先后不同的认识,逐渐渗透进入代理产业。目前稍微清晰一点的是电子商务:一个点击,可以带来几十成百上千的需求者,这才是最精彩的部分,已经创造了世界奇迹,但是肯定不会止于这点变革。所以当代的经济奇迹实际上都暗含在这些人的手指间。就是这个社会现象被人们称为大数据,其实,数据确切的说法应该是,公众信息预制代理产业化发展之前的社会成员因迷茫和不知所措,对其采用的临时性称呼。因为,大数据,只是每个人手中的手机,或者家中的电脑,与不知哪里的另一台电脑,通过网络联系上了无数的电脑时,相互间产生的数据。无数的人在操作手机或者电脑,于是就产生了庞大的数据流,还有比这个说法更清楚的吗。是这些数据生成的过程又产生了无数的需求,激发了更多的链接活动,从而唤起了人们对其商业模式的追逐,这种不断激发、不断联想、不断追逐的过程演绎了当下虚拟世界的新文化,对现实世界带来了巨大的冲击。其实人们更应该问问大数据究竟有多大,毕竟很多信息数据并无价值,但是人类存在价值在,大数据就应该无限大,是数据的生成期限价值决定了它的大小,目前距离其期限价值起码还有千万倍的距离。那么还有什么需要发展的吗,当然,我们距离数字化社会文化还远着呢。具体说就是智能手机提供了这样一个历史机遇,发展公众信息预制代理产业,所有日常产生的信息都将成为公众信息,被各种行业、各种企业用来提供某种产品或者服务,只是目前我们的社会隅于现有体制利益关系,无法跳出局限,已经知道对现实冲击巨大,又不能武断斩断过去,只好苦苦寻找便于接受的出路。基本概念上也确实没能理解清楚,于是只好跟着大家人云亦云。

2.公众信息预制代理必然要经过一个时代的洗礼,蜕变才可能成熟

简单说,It产业要围绕各类社会组织和普通百姓的社会生活提供各种信息服务,用打比方的方式解释这个情景,其实就是在互联网上也要向现实世界一样完成社会分工,底层数据结构的搭建大概算上层建筑;各个行业、各个方面地区的社会经济生活的信息数据大概算第一产业,要有人建立企业,专门处理自动生成的数据,就像地底下的煤炭石油,是自动生成的一样需要有人来勘探开采。有了初级原料便要建立企业生产各种产品,有企业消费的产品,也有最终消费者需要的商品。就像It产业的粮食棉花钢铁是什么,It产业的机械加工厂、食品加工厂、钢材加工厂甚至化学品加工厂是什么,IT产业不能永远留在只是开商店上吧。当前,国家很多行业产能过剩,很多原因正是传统经济难以获得必要决策信息,造成的投资盲目。文化产业产品价值评估类信息产品至今在我国没有形成。何况传统经济要和信息产业融合,电子商务是目前融合发展最快的一个方面,其他的比如金融信息商品,体验信息商品,创业信息商品,教育信息商品甚至政治信息商品等等还远未起步。一方面是体制局限,另一方面也是认识上的局限。公众信息到底是哪些信息,预制要预制成什么样,为什么要预制成这个样,有诸多问题正等着全社会破解。总之,一方面传统领域我们就没有能够发展起来信息产业,进入数字网络时代这个局限延伸至数字读物时代;另一方面数字读物时代我们对新媒体的理解和认识以及全部的局限,必然又深刻影响着未来的发展。但是人类绝大部分信息要进入网络,在这里诞生、升华、繁衍,就像传统产业一样,也会有基础信息产业,也会有服务信息产业,也会有加工信息产业,在这里都将成为脱离传统产业的部分,由专门的企业代理生产,所谓信息预制及代理的发展正是这个意思,只是目前我们只知道需要有专门的企业来代理,并不清楚代理的先后和具体过程。简单说,应该至少包括几大类,比如已经生成在传统媒体上的数据信息,或者是人们使用传统媒体的信息,比如人们阅读外语的实际效率,多长时间可以记住多少个单词,多长时间可以记住多少个句子的内容,在传统媒体环境下这些研究是很费劲不可想象的。但是在新媒体环境下就相应容易多了,只要有人接受委托代理制作出相应的软件,提供给出版商,卖给消费者便可以测试到读者的这些信息,我们称这种图书为测试型教材。这类图书的生产的企业的出现,恐怕要经过IT企业家们漫长的艰辛探索过程,才能形成成熟的产业,才成形成相应的虚拟网络里的基础产业。

3.发布信息的权利分化出现,社会各界只应该更好的规范原有的社会权利分工

自媒体最大的问题是改变了信息话语权的分布,从物理的空间扩展到信息质量的层面。传统媒介时代,人们没有其他可选择的信息渠道,收集或者发布信息,数字读物时代不然,每个人都可以发布信息,也可以任意接受信息,这里包含了两个层面,一个是发布的层面,大家都可以发布信息了,灌水的事情在网络上已经变成令人愤怒、反感的社会活动情节,但是你要是写一段信息量饱满,质量很高的文字人们还是要争相传阅,点赞,收藏,转发的。问题是一片汪洋里哪一瓢水滴质量高,没有编辑的专业筛选处理,好文章可能就会被淹没,而且有明白的人或许又要盗版剽窃,版权管理分层变成了非常棘手的事情,出版的实质由出一块印刷版,变成了标志信息作者归属;另一方面接收信息的人,客观的局限对接受信息也有种种局限,眼睛的任意浏览视界局限,耳朵的注意倾听的听界局限,以及理解能力的头脑领会的局限,甚至人体的感知局限,都属于需要了解、认识,规范和建设的过程。没有这个过程一切都是空话。

再有自媒体也有自己使用媒体的意思。自己使用能干什么,目前已经被开发的领域包含了教育,但是延续传统教学模式无法开启数字读物的理解消化,因此颇具挑战性,但是不理解数字读物的根本精髓,很难接受这个新兴媒体出现。比如前文所述的测试性教材,没有类游戏的使用技巧,这个教材可能永远停留在一般游戏的内容上。没有测试教材,传统教学模式体制才得以继续延续。社会分工只能延续旧的社会模式。因此,数字读物的出现需要有相应的深刻的社会体制的变革。具体说就是关于社会信息的权利分化,需要经过一场深刻的革命。这个革命可能不是政治性的,但是必须是社会体制性的。

4.平面媒体的语言单位:字词句段篇章册卷,各种新媒体都要吸纳接受供人阅读

人们熟悉:字、词、句、段、篇、章、册、卷,熟悉到了根本没想过它的客观存在。进入数字读物时代这个事情突然漫出来,摆在大家面前,流媒体代表了多媒体时代的开始,文字的所有使用形式及客观作用都将逐步显现和其他媒介的融合使用,熟练与否不重要,重要的是,这是一个历史过程,这个过程必须也必然融合多媒体形式。目前的技术只能是分头植入文本,因为我们还没有一个文本可以三种东西,或者可以三种同时产生。毕竟数字流媒体占用数据量非常大,大的难以想象。我们不知道蒙太奇之类的东西能否融入进来,更不知道还有什么哪个民族的语言可以融入新媒体,只知道未来媒体会有天翻地覆的变化,各种社会机构、企业、个人的种种事务,无一例外的要进入国家权力中心处置。

三、 暂时说不清的原因

相关学科的研究进度限制了信息预制代理业的发展,首先是人们为什么认识不了数字读物的特点,不想理解?不是,更不是不愿意理解,最重要的是相关研究太滞后。比如,如何认识当下新媒体,是当作一个一般通讯技术的更新换代,还是新的媒体时代的来临,这里至少有几个最基础的研究尚属空白,有必要尽快完成。

一个是数字读物的人体工程学,我们还不清楚人类视界浏览的局限,具体对文字的大小、颜色的深浅、变化的速度等,具体数据以及相应的研究;没有这个研究成果,人们就无法为所有的数字图书的编制找到最基本的技术依据。再一个是数字读物阅读行为学的研究,具体人们的阅读行为是个什么样子,我们没有任何人类统计学意义上的详细了解;还有信息预制代理产业究竟应该如何建设,产业链或者产品价值如何界定;还有版权的实质由于数字读物的出现又出现了巨大的变化压力,没弄清楚出版的实质很难对今后网络版权进行清晰明白的界定,这一代人都无法得到社会秩序上的平静。从国家层面当然还涉及其他私人生活领域。但是没有相应的理论体制支持,便没有相应的意识形态的安排,没有相应的上层建筑建设,自然经济体制发展就成了无本之木,无水之源,除非有一天上层解决了理论认识问题,下层才会跟着前行。由下向上的发展过程存在可能,但是成功几率极小。即使成功,可能也是非常机巧的偶然。

目前中国有了天猫、淘宝等电子商务,但是公众信息预制就只有这些吗?怎么可能。凡是可以上传上网的东西,原则上都是公众信息,都可以找到代理产业,或者可以说都迟早会有代理企业去从事生产,并提供给广大用户,就像电子邮箱里会根据读者每天上网浏览页面的随机统计,将读者感兴趣的商品信息发送过来,这是网络企业为商品销售企业代理制作的信息。所有的教材其实一旦做成测试型,就都可以由消费者自主点击学习,象玩游戏一样学习,好的教材可能也会令读者痴迷学习,很快学会一门知识。但是,我们能接受这个认识吗。不能接受当然就不可能去制作去代理这个服务。

本文来源:https://www.2haoxitong.net/k/doc/55bbe616f61fb7360a4c6565.html

《大数据的“大”指的是什么Yw.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式