最新大数据心得体会(六篇)

时间:2023-07-07 11:32:05 作者:曹czj

我们在一些事情上受到启发后,可以通过写心得体会的方式将其记录下来,它可以帮助我们了解自己的这段时间的学习、工作生活状态。大家想知道怎么样才能写得一篇好的心得体会吗?以下是小编帮大家整理的心得体会范文,欢迎大家借鉴与参考,希望对大家有所帮助。

最新大数据心得体会(六篇)篇一

大数据时代已经悄然到来,如何应对大数据时代带来的挑战与机遇,是我们当代大学生特别是我们计算机类专业的大学生的一个必须面对的严峻课题。大数据时代是我们的一个黄金时代,对我们的意义可以说就像是另一个“80年代”。在讲座中秦永彬博士由一个电视剧《大太监》中情节来深入浅出的简单介绍了“大数据”的基本概念,并由“塔吉特”与“犯罪预测”两个案例让我们深切的体会到了“大数据”的对现今这样一个信息时代的不可替代的巨大作用。

在前几年本世纪初的时候,世界都称本世纪为“信息世纪”。确实在计算机技术与互联网技术的飞速发展过后,我们面临了一个每天都可以“信息爆炸”的时代。打开电视,打开电脑,甚至是在街上打开手机、pda、平板电脑等等,你都可以接收到来自互联网从世界各地上传的各类信息:数据、视频、图片、音频……这样各类大量的数据累积之后达到了引起量变的临界值,数据本身有潜在的价值,但价值比较分散;数据高速产生,需高速处理。大数据意味着包括交易和交互数据集在内的所有数据集,其规模或复杂程度超出了常用技术按照合理的成本和时限捕捉、管理及处理这些数据集的能力。遂有了“大数据”技术的应运而生。

现在,当数据的积累量足够大的时候到来时,量变引起了质变。“大数据”通过对海量数据有针对性的分析,赋予了互联网“智商”,这使得互联网的作用,从简单的数据交流和信息传递,上升到基于海量数据的分析,一句话“他开始思考了”。简言之,大数据就是将碎片化的海量数据在一定的时间内完成筛选、分析,并整理成为有用的资讯,帮助用户完成决策。借助大数据企业的决策者可以迅速感知市场需求变化,从而促使他们作出对企业更有利的决策,使得这些企业拥有更强的创新力和竞争力。这是继云计算、物联网之后it产业又一次颠覆性的技术变革,对国家治理模式、对企业的决策、组织和业务流程、对个人生活方式都将产生巨大的影响。后工业社会时代,随着新兴技术的发展与互联网底层技术的革新,数据正在呈指数级增长,所有数据的产生形式,都是数字化。如何收集、管理和分析海量数据对于企业从事的一切商业活动都显得尤为重要。大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的竞争中摆脱受制于人的弱势境地,才能把握发展的方向。

首先,“大数据”究竟是什么?它有什么用?这是当下每个人初接触“大数据”都会有的疑问,而这些疑问在秦博士的讲座中我们都了解到了。“大数据”的“大”不仅是单单纯纯指数量上的“大”,而是在诸多方面上阐释了“大”的含义,是体现在数据信息是海量信息,且在动态变化和不断增长之上。同时“大数据”在:速度(velocity)、多样性(variety)、价值密度(value)、体量(volume)这四方面(4v)都有体现。其实“大数据”归根结底还是数据,其是一种泛化的数据描述形式,有别于以往对于数据信息的表达,大数据更多地倾向于表达网络用户信息、新闻信息、银行数据信息、社交媒体上的数据信息、购物网站上的用户数据信息、规模超过tb级的数据信息等。

一、学习总结

1. 大数据的定义

对企业未来运营的预测。

二、心得体会

在如此快速的到来的大数据革命时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。职业规划中,也需充分考虑到大数据对于自身职业的未来发展所带来的机遇和挑战。当我们掌握大量数据,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给我们日后创业带来价值。借力,顺势,合作共赢。

一、什么是大数据?

百度百科中是这么解释的:大数据(big data),指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。我最开始了解大数据是从《大数据时代》了解到的。

大数据在几年特别火爆,不知道是不是以前没关注的原因,从各种渠道了解了大数据以后,就决定开始学习了。

二、开始学习之旅

在科多大数据学习这段时间,觉得时间过的很快,讲课的老师,是国家大数据标准制定专家组成员,也是一家企业的大数据架构师,老师上课忒耐心,上课方式也很好,经常给我们讲一些项目中的感受和经验,果然面对面上课效果好!

如果有问题,老师会一直讲到你懂,这点必须赞。上课时间有限,我在休息时间也利用他们的仿真实操系统不断的练习,刚开始确实有些迷糊,觉得很难学,到后来慢慢就入门了,学习起来就容易多了,坚持练习,最重要的就是坚持。

最新大数据心得体会(六篇)篇二

“大数据”概念早在1980年就有国外的学者提出,可是最近几年才广泛受到大家的关注。当“大数据”这个概念传到中国的时候,瞬间引起了轰动。随即,各种有关“大数据”的资料和书籍充斥的我们的视野。随意打开某个电子商务平台图书类页面,在搜索框中搜索“大数据”三个字,就会出现好多本有关“大数据”的书籍。可是,有一个很有趣的现象就是:几乎所有的平台上,出现的第一本关于“大数据”的书籍一定是《大数据时代》。一点进去,这本书推荐栏里的第一句话就是:迄今为止全世界最好的一本大数据专著。同时,为这本书做推荐的都是各行业的精英领袖。所有“大数据”方面的书籍也是这本书销量最高,评价最好。

我从来不会因为哪本书畅销和很多人推荐就盲目跟风的去看一本书。因为我知道通常在这种情况下选择一本书,整个阅读的体会和感受是无法遵从自己的内心的,整个过程都很容易夹杂着别人对这本书的感受。所以通常我读书的节奏大多都是跟不上“潮流”的,但往往经过风雨洗礼之后沉淀下来的都是精华。坦白讲,阅读这本书的初衷并不是因为我想从书中获取到多少大数据方面的精华,只是很想知道对于这么一个很直白的名词,作者是怎么写出这么厚的一本书的。这种初衷或许很无知和幼稚,可就是这种“愚蠢”的好奇心,让我更透彻的看到书中的精华。

在看《大数据时代》这本书之前,我的所有读后感都是集中在书籍给了我什么思考。对于这本书的读后感,除了观点碰撞之外,我还会加上大部分个人看这本书的体会。因为这本书,已经完全让我模糊了大多数人口中的“全世界最好的书”是一种什么标准。也许《大数据时代》真的无法承载那么高的赞美!

大数据时代的入门书

看完这本书,我随意调查了一些阅读过这本书并且给这本书绝对好评的朋友。询问他们这本书好在哪里?大多数的回答是说《大数据时代》这本书让对大数据一无所知的他们了解了大数据这个概念,同时通过很多案例说明原来大数据能有这么大的用处,影响会有这么大!仅此而已。我看完这本书最大的感受是这本书分为上、下两部分。前120多页为上部分,后120多页为下部分。之所以说《大数据时代》是一本关于大数据的入门书,是因为这本书用了前面120多页的篇幅反复的强调大数据的出现对社会发展影响很大,并且要人们转变小数据时代惯有的思想。所以整本书的前半部分就强调大数据时代的三个转变:1、大数据利用所有的数据,而不再仅仅依靠一小部分数据,不再依赖于随机采样。2、大数据数据多,不再热衷于追求精确性,也不再期待精确性。3、大数据时代不再热衷于寻找因果关系,而是追求相关关系。所以整个上半部分没什么可详说的。我们重点聊聊本书的后半部分。

既然一直都在强调大数据对我们的意义,总要有具体体现。整本书中,我感触最大的一个案例就是某公司通过分析大数据发现:新品发布的时候,旧一代的产品可能会出现短暂的价格上涨。因为人们在心理上就认为新产品的推出,旧产品就会便宜,从而就会提高购买量。这个发现和我们平常的心理是完全违背的,而且如果不用数据来证明,直接讲道理给大家可能还是无法相信。这就是大数据对我们很多传统思维的颠覆。一旦涉及到思维的改变,往往就会引起整个社会的大变动。

大数据这个概念的出现,让大数据逐渐发展形成一条价值链。在这条价值链上,数据本身、技能和思维是最重要的环节。随着互联网技术的发展,越来越多的公司都能收集到大量的数据,这些数据也会越来越公开。可是在这些公司中,不是所有的公司都有从数据中提取价值或者用数据催生创新思想的技能。于是就会出现以下两种公司,一种是掌握了专业技能但不一定拥有数据或者提出数据创新性用途才能的公司,另一种就是拥有超前思维,懂得怎样挖掘数据的新价值的创新公司。短时间内,我们可能会感觉拥有创新思维,懂得挖掘出数据新价值的大数据思维是最重要的。可是等到产业成熟之后,所有人都知晓了大数据的意义,所有人便开始挖掘自己的大数据思维。同时,随着科技的进步,掌握大数据技术的也将成为常态。所以到后来,整个价值链的核心环节还是回到了数据本身。而到那时候,大数据的公开性也就越来越小。

在大谈完大数据对人类发展的积极意义之后,作者也考虑到大数据时代的风险。这一部分是作者脑洞大开的精彩之处,同时也是最荒谬的一部分。书中说大数据时代将要惩罚未来犯罪,这样可以在嫌疑人在可能犯罪之前就把犯罪行为给防止。这样的社会,大数据俨然已经延伸到了我们每个人生活的点滴。几乎我们在生活中所做的一切都在大数据的“监控”之下,我想到那时候,别说我们每个人的隐私已经没有的了,严重一点可以说是我们可能连人都不算了。在我们人的社会属性中,自由权利是一项很重要的指标。通过大数据惩罚人的未来犯罪已经否定了人的自由选择能力和人的行为责任自负。同时,由于数据是永久保存,大数据预测也是通过每个人之前的数据来判断,所以大数据同样也否定了人的求善心理。还有,从现在各种大数据预测的结果来看,很多发言人都说大数据不是百分百的准确。所以利用大数据来判断人的行为发展已经违背了大数据不追求精确性的特征,这也是书中自相矛盾的地方。

对于一个新事物,如果能让大家了解这个事物并且对此产生兴趣,这已经算是一本不错的入门书了。

大数据时代的心灵鸡汤

从小到大,鸡汤对于我们来说一直都挺珍贵的。身体虚弱了,喝点鸡汤能够补充营养。心灵受伤了,看点心灵鸡汤可以鼓舞人心。可是近几年,人们生活水平提高了,营养富余,鸡汤已经不是人们补营养的期待了。同样,心灵鸡汤也是如此。

心灵鸡汤其实是一个很虚伪的东西。很多人都被心灵鸡汤诱人的外表给迷惑。在我看来,心灵鸡汤很大的一个特征就是:立人的志,但是就不告诉你实现志的方法。很多人每次在失意的时候就喜欢看心灵鸡汤,希望能得到慰藉。看完后也觉得醍醐灌顶,感觉整个世界都亮了。但又有几个人想过喝完这些鸡汤之后你除了看似重拾梦想,你还获得了什么?你知道怎么去做吗?《大数据时代》就是这样一本书。整本书从头到尾都在向读者讲述大数据的意义,当然期间也会用相应的案例来证明大数据确实有这样的能力。但是,整本书从没有涉及到技术层面的问题。或许对于大数据这种依靠互联网技术的新事物,即使向读者讲技术,也没有几个人看得懂,可是整本书没有一点关于大数据思维的技能引导。给出的案例中只有少数案例向读者讲述了这个公司为什么要利用大数据来解决这种问题,大多数都只是告诉读者国外某家公司运用大数据得出了某种结论。同时,在本书中文译作者写的序里,强调自己翻译这本著作的一大优点是可以结合国内的案例来分析书中的理论,结果,看到最后一页都没有看到一个国内企业关于大数据运用的案例。

之所以我称之为“心灵鸡汤”,还有一个原因就是作者在书中大讲特讲的大数据的作用,事实上按照现在的经济发展水平和社会文明发展程度是很难实现的。书中很多时候的理论都是要建立在社会各项文明都发展健全的基础上才能实现。

大数据的“传销手册”

看到这个标题,大家可能会觉得我夸大其词,受到如此多人好评的书怎么是“传销手册”呢?对于这个表达,我只想说两点:1、此说法仅代表我个人观点,是否认同是个人问题。2、此说法主要针对本书的上部分。

我们都知道传销组织在发展下线的前期是要花大力气去培训的,也就是洗脑。而对于一个陌生又很难以理解的事物,最好的“洗脑”方式就是重复。《大数据时代》这本书就是运用这种方式,前半部分为了让读者能够接受“大数据”这个概念,作者反反复复提醒读者大数据不是随机采样、不追求精确和不寻找因果关系。同时用很多看似很通俗易懂其实看完后还是不知道说了什么的案例来让人信服大数据的作用。书中的后半部分虽然也是用这种方式来感染读者,可后半部分中作者的畅想和对大数据的威胁分析还是对读者有一些实质意义的,所以后半部分的“传销”影响就不是很重要。

大数据时代是未来的趋势,这谁都不会否认。大数据改造了我们的生活,改变着我们的世界。不管它是以一种什么样的姿态面向世界,它都没有错,因为大数据只是一种工具。但当人类开始质疑甚至恐惧大数据的时候,人类就该思考自己是否利用好这个好工具了。

最新大数据心得体会(六篇)篇三

这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。

《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。

下面来重点介绍《大数据时代》这本书的主要内容。

《大数据时代》开篇就讲了google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了20xx年美国的h1n1的爆发地与传播方向以及可能的潜在患者的事情。google的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。同时google的预测与政府数据的相关性高达97%,这也就意味着google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。

接下来,维克多又通过了ibm追求高精确性的电脑翻译计划的失败与google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼近事物的原貌。

之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。

无论如何,大数据时代将会到来,不管我们接受还是不接受!

我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被引诱的对象。所以说,小心你在网上留下的痕迹。

我喜欢这本书是因为它给我展现了一个新的世界。

最新大数据心得体会(六篇)篇四

《大数据》不是一本纯技术的书籍,作者用美国多年来丰富而详细的案例说明了大数据的趋势和发展历程,大数据的初衷就是将一个公开、高效的政府呈现在人民眼前。书中从美国《信息自由法》说起,其发展历程充满了坎坷,经过各个时期信息自由倡议者的努力,终于出现端倪,并迅速成长,充分体现出美国政府的信息必须被公开,以及个人的隐私必须被保护。人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。

《大数据》开篇讲述美国《信息自由法》历经多任总统,其中有支持者,也有反对者,最后终于签发,标志都美国进入信息公开及隐私保护的大数据时代。现如今全世界现有60多个国家制定、实施《信息自由法》。

随着《信息自由法》的颁布,以及现代科技的发展,会产生越来越多的数据。数据主要来源是:1.各行各业通过计算机产生了大量的数据;2. 业务数据3. 民意数据4. 环境数据。并且数据在数量、速度、多样性三个维度迅速增长,促使数据帝国逐渐兴起。

首先,在治国方面。1.循“数”管理,减少交通事故死亡人数。2.用数据进行医疗福利打假,可为政府节省开支。3.警方通过compstat系统,分析犯罪数据,预知犯罪地点。

其次,商务智能方面。1.数据仓库,2.联机分析(olap),3. 数据挖掘,4. 数据可视化。

当然随着数据的增多,如何收集和使用这些数据,就需要制订一系列的法则。1.收集法则:减负;2.使用法则:隐私;3.发布法则:免费,4.管理法则:质量。其中数据质量最为重要,为了保证数据质量颁布了《数据质量法》,同时也带来了困惑,即给商业组织带来了质疑政府公布数据质量的手段,对于这一手段,满足其商业利益,是民主与商业组织之间的对抗和冲突。

同时,统一分析和使用大数据与个人隐私产生的冲突。通过中央数据银行和全国统一id就获得某个人一生的行动,违反了个人隐私法,但不分析这些信息,又可能导致恐怖分子的袭击,最终以保护个人隐私胜利,但政府还是想执行统一身份认证。

奥巴马的上任加速了政府数据开放的进程,奥巴马上任后立即任命首席信息官,由首席信息官在4个月内推出政府大数据网站,在互联网上为民众提供开放的政府数据。阳光基金会和个人利用开放数据开发出各种分析工具,充分体现出数据价值。

但公益组织并不满足开放数据的数量,为了让民众监督一个更为公正透明的政府,公益组织要求公开白宫访客记录,但这并不是一个简单的要求。经过公益组织不懈的努力,白宫终于公开了访客记录,但公益组织发现了更多的问题,白宫也提出将继续修改访客记录的方式。

大数据有效的监督了政府的公正与民主。民主不是一个结果,而是参与的过程,人民要不断的争取才能实现民主。

本书结尾也较详细的描述除美国外,其它各国通过大数据走向民主的进程,充分说明了这一进程是一个大趋势。首先,英国紧随美国后面实施数据开放,虽然晚于美国,但发展飞快,开放的数据量已超过美国。其次,即美、英两国开放数据之后,更多的国家也加入到其中。20xx年9月20日,8个国家宣布成立“开放政府联盟”,要想加入需具备4个条件:1.财政透明,2.信息自由,3.财产公开,4.公民参与。截止20xx年4月25日已有50个国家加入。

在大数据时代,数据就是直接的财富,数据分析和挖掘能力就是国家、企业的核心竞争力。中国应该摘下千百年来差不多先生的标签,尽快赶上西方国家大数据的步伐。

最新大数据心得体会(六篇)篇五

读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。

“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。

近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。

当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!

《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。

可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!更何况还有两个更可怕的事情。

其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。

还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。

所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。

最新大数据心得体会(六篇)篇六

如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。

一读

舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。

我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。“大数据的简单算法比小数据的复杂算法更有效。”更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。“不是因果关系,而是相关关系。”不需要知道“为什么”,只需要知道“是什么”。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。

世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出“不是因果关系,而是相关关系。”这一论断时,他在书中还说道:“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。”[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。

大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可“量化”,大数据的定量分析有力地回答“是什么”这一问题,但仍然无法完全回答“为什么”。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节“掌控”中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。

再读

概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4v特点:数量(volume)、速度(velocity)、品种(variety)和真实性(veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”[ii]其实,概念的界定要看研究者从哪个角度来研究它而定。

科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。”[iii]舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里谈到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”[iv]用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。

问题是研究的价值基点,“大数据”不是舍恩伯格研究的问题,而是研究对象,他研究的是数据处理和信息管理问题,同时也讨论信息安全和网络伦理问题,还引发哲学上的思考,哲学史上争论不休的世界可知论和不可知论转变为实证科学中的具体问题。可知性是绝对的,不可知性是相对的。“大数据”之所以为大是因它引发人类生活、工作和思维的大变革,从这个意义上来看,《大数据时代》的意义不仅在于它讨论了若干重大问题,而且对研究者开出了一个问题清单,从而引发更多人来探讨这些有趣的问题。

《大数据时代》实际上主要是一本讨论数据挖掘的书,数据挖掘与数据分析是不同的概念,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。而数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据挖掘主要运用计算机来进行处理,而数据分析既要用计算机也要人工分析,是计算机科学与人文价值判断的统一结合。换言之,《大数据时代》并不是一本讨论大数据所有问题的书。

《大数据时代》也是一本讨论互联网发展的书,从数字化到数据化,同时有浓厚的未来学色彩。当文字变成数据,我们进入了互联网;当方位变成数据,我们进入了物联网;当沟通变成数据,我们进入了下一代互联网。一切可量化,万物皆数据,正是当今互联网世界的真实写照。面对于这样的世界及世界的未来,在《大数据时代》出现最多的词是“思维”和“方法”,因此也可以把这本书视为思维科学应用研究的书。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。

三读

今年国庆节前一天,中共中央政治局们来到中关村搞集体学习,调研、讲解、讨论创新驱动发展战略。包括、在内的七位全部出动来到中关村,这是历史上没有过的,百度、联想和小米的负责人,有了一次直面最高层汇报工作的机会。雷军和柳传志,讲解的都是本公司的各种情况,李彦宏则没有讲百度的广告业务发展得如何好,而是讲起了大数据。在讲解中,李彦宏认为大数据有两个重要价值,一是促进信息消费,加快经济转型升级;二是关注社会民生,带动社会管理创新。这些价值也是目前党和国家领导人最为重视的,可见《大数据时代》既有理论价值也有现实意义。

当今大数据正在影响着新闻传媒业,大数据新闻、大数据营销、舆情分析、受众(用户)研究……数据分析师变身新闻编辑,大数据正改变新闻生产流程、大数据在创造传媒新业态。“不妨想象一下,随着数据的进一步增加,坐拥用户资源的新媒体们完全有能力通过数据挖掘,分析用户癖好,向电视台定制一部电视剧甚至向好莱坞定制一部电影。到那个时候,电视台一如那些家电厂商们,曾经产业链的上游‘王者’,将彻底成为一个产业链最低端的内容代工厂。”[v]然而,情形也远没有人们想象的那么乐观,李彦宏指出目前多数所谓的大数据公司其实还是空壳子,因为数据还没有完全开放。他认为必须在政府层面上推动才能真正实现大数据的开发与利用。我在讨论大数据时代的舆情监测与预警时说道:“经典自由主义传播学说对媒体的定位:秉持公正、客观立场的媒体被称为代表公众监督政府行为的‘看门狗’。其实,媒体既是公众利益也是国家利益的‘看门狗’。要看好门就要瞭望、洞察社情民意,传统媒体信息反馈渠道单一,视野、人力十分有限。而开放互动的新媒体平台却大有可为。作为公共信息发布平台的微博可以成为政府及时了解社情民意,从而选择正确治理路径的‘导盲犬’。”[vi]遗憾的是目前我国的数据平台还没有完全开放,真正的大数据时代还没有到来。

与国内不少教科书写法的专著相比,国外的书写得更有趣,尤其是大学者写的,不仅视野开阔,而且能够深入浅出。《大数据时代》不到22万字,却有上百个学术和商业的实例,丰富翔实的例子让读者感到通俗易懂,深奥的理论看起来也不费劲。这恐怕与舍恩伯格既是学者也是专家,既有理论又有实践有关。反观我们些学者故弄玄虚而示高明,实际上是把读者拒之门外。我觉得优秀的科学家也应该是一个科普作家,优秀的学者也应该是一个不错的传播者。当然国外学术著作也有一个翻译问题,这本书译得还不错。此外,《大数据时代》还附有不少it界名流的推荐意见,虽是出版商的发行所为,对解读此书也不无益处。

除了《大数据时代》,舍恩伯格还有一本《删除》也值得一读。要研究大数据不能只读一本书,该书译者周涛教授还推荐了三部国内出版的大数据方面的专著:《证析》、《大数据》、《个性化:商业的未来》。相比《大数据时代》的宏大视野,这些书就大数据某一局部问题给出深刻的介绍和洞见。我也推荐读一读中国工程院李国杰院士和中科院计算所副总工程学旗合写的文章《大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考》。

虽说开卷有益,但是由于每个人的时间精力有限,对于一个研究者来说,不读什么书甚至比读什么书更重要。我认为书有三种:有用的书,主要是应用类的专业书;无用的书,主要是形而上的思想类;无字的书,人间百态,社会现实。可偏重但不应偏废。对于学生来讲这三类“书”都该读一些,对于研究者则要读哪些解决关键问题的书,《大数据时代》就是这样一部书。当然,并非第一个读者都是研究大数据的,但进入大数据时代,还有什么东西与数据完全没有关系呢?麦肯锡全球研究机构认为,未来十年里有12项对经济发展产生重大影响的技术,其中包括三项新媒体技术:移动互联网、物联网和云计算。这三项新媒体技术都与大数据密切相关,而这些新媒体新技术的发展都影响着当今的新闻传播业。阅读此书至少给我们研究新闻传播学带来一些启迪。我觉得一本书的价值不在于让你顶礼膜拜,而是引发广泛而深入的讨论。

“凡是过去,皆为序曲。”读完此书,我们对大数据的认识才刚刚开始。

相关范文推荐

猜您喜欢
热门推荐