大数据技术与应用(4):大数据未来的应用方向和我们面临的挑战

x
用微信扫描二维码
分享至好友和朋友圈

  同世界先进水平相比,我国的大数据在互联网核心技术上与发达国家还有很大差距,甚至严重受制于人。我们的如何推动大数据技术产业创新发展,构筑网络强国呢?

  让医疗数据流动起来,实现更多医院医疗数据共享,利用数据分析,在用户中挖掘潜在“民心”,共享的大数据产业链价值链和生态系统正在我们身边逐步构筑。大数据应用,未来会走向何方?我们面临怎样的挑战?

  

  

本文根据中国经济大讲堂《不容错过的大数据时代》,由加米谷进行整理成文,仅供学习参考。 大数据据技术与应用(1):大数据的价值和意义:https://www.toutiao.com/i6774292166886818308/ 大数据技术与应用(2):大数据时代,传统企业该如何转型:https://www.toutiao.com/i6774308902889587211/ 大数据技术与应用(3):大数据助力社会治理和我们的日常生活:https://www.toutiao.com/i6774656681008693771/

  五、大数据未来的应用方向和我们面临的挑战

  我们看看现状,实际上我们现在大数据应用大体上是分成3个层次:

  第一个就是描述性分析

  描述性分析什么呢,指关注现在发生了什么事情,然后把这个事物的发展历程给你可视化的展现出来,通过图可视化的方式展现出来,把当前的数据分析以后,把它的态势给你展现出来,让你能够把握这个事物发展的一个基本态势,这就是描述性分析。

  第二种,我们称之为预测性分析

  就是要在描述基础上,你把现在的状况搞清楚后,它可能怎么走,再进一步可能发现的事物的趋势是什么。比如说谷歌的流感预测,它就预测可能在什么地方发生。比如说奥斯卡获奖的预测,那它就可能要发生,就这就是预测性分析。

  但也有人问我说股票能不能够预测,理论上是可以的,但你预测了别对外说,你来看这个结果,肯定是可以的,但如果以你对外一说,那就肯定又不灵了,它和其它的都不一样啊,对外一说,别人都真的到那儿去。就像有时候我们交通智慧交通一样的,一说什么地方不堵,所有人都往那儿去了,马上就把这边堵了。它这种预测一定是一个客观的事实的数据的收集才能做到。

  第三种分析是什么呢,叫做指导性分析

  就是说关注选择做什么,要呈现不同的决策后果,就是我根据现在的态势,也能预测到未来的变化,那么预测到未来的变化后,我现在做什么对未来有什么影响,要反过来影响我想未来。如果说打仗,用大数据指挥打仗也是一样的,如果我做这个决策,会演变成什么结果?

  这就叫指导性分析,这个是最高级的一种方式。要知道我们现在该怎么做。

  实际上当前大数据应用来讲,总体的结论我认为还是一个初级阶段,还远远的不够。从应用层次上讲,就是描述性预测性的东西多,指导性应用少;从数据源的角度,从单一的数据源来进行分析的多,从多元数据的应用上,基于已经存在的数据,就是你现在有什么数据,我就玩什么数据,从数据里面找东西多,但是我主动去搜集数据的应用也相对偏少。

  

  提问:在互联网或者是大数据的创新这个领域,尤其是在比如一些数字的经济的这些共享,还有一些基础设施的建设,包括我们大数据的一些创新,还处于一些劣势。我想听梅院士给我们介绍一下最主要的我们还处于哪方面的劣势?

  答:最大的一个差距就还是我们的后发所带来的问题,我们相对是跟着别人走,在信息技术起步的时候中国并没有参与。所以说我们叫做核心技术、基础技术缺失。这是我们最大的问题。

  我们经常讲我们国家的信息产业叫做缺芯少魂,没有芯片,CPU不是我们的,操作系统我们不能够控制,这叫缺芯少魂。那我们现在很多企业做得也不错了,但是我们叫做什么呢,低端化、空心化。空心化就讲了我们应用都做得不错,我们很多企业都在做应用,但是我们的高端的设备做不出来。

  这种情况是一个长期的一个过程,但是现在可以看到我们这个东西正在逐步逐步的逼近,我们很多能力已经具备了,现在比如说像BAT,在应用规模上毫无疑问都是世界级的大公司,他们也产生了很多世界级的应用,在国际上是没有的,他们搭建的平台的处理能力也是世界级的,他们的数据中心也是世界级的,但是模式创新上有没有新的东西。

  过去我们经常谈,我们在互联网的模式上借鉴偏多,创新还是不多,但是现在我们开始有了,也有很多互联网的创业,比如说像微信之类的应用,那就是很典型的一种创新,即时通讯在这个领域,它基本上把中国的市场给占住了。那么当然还有其他的互联网公司做的,我相信都是都是很不错的。

  第二个趋势是什么呢,就是我们的很多环境还没建立起来。刚才你谈到的数据的共享还不够,那么国家层面,法律法规层面对数据共享的支撑也还不够。

  我不知道大家关注到没有,如果你用头条看新闻的时候经常会给你推送什么,如果你昨天正好在京东上查询了什么东西,我估计今天的头条就会给你推相关的东西,如果说你在携程上查了什么东西,它也会在你上互联网的时候为你推相关的东西。这些数据的流通过程共享产生好处,产生便利是必然的,但是好像也没征求你的意见,可以把你的信息共享出去,所以这是法律法规需要去规范它的。

  所以共享了这一轮,从国家层面主要在推的是政务数据的共享和开放,如果大家看15年8月份到9月5号正式发布的那个,叫做《促进大数据行动纲要》三项任务,第一项任务就是政务数据的共享开放,而且有明确的时间表,国家明年完成共享,今年是把所有的目录完成,

  明年完成共享。2020年向社会开放,国家的网站都云出来了,政务数据的都拿出来之后,这些部门之间的共享就对我们每一个老百姓都能带来好处,让我们少跑腿,政务数据的共享出来,就会让我们每一个创业的公司能有更多的数据源去做你的运用创新,大体上可能是这样。

  我说共享开放也不够。我觉得第三个不够缺陷是什么,就是我们中国发展到的现状,按中央的说法是我们现在已经走入一个新时代,要走向一个全面强起来的一个征程,自信心够不够?

  我们还得有一个自信,我们有庞大的人才资源,我们能不能够建立自己的自信心,我们别在技术上去一味的模仿,跟踪别人走过的东西,靠我们的人口红利来形成一个市场规模,靠我们的人口规模来形成竞争优势。我想这个可能不是,我们更多的模式上的创新也是需要的,

  在互联网时代,可能很多东西只有想不到,没有做不到。今天我们的自信心,我们不管在技术上长期的坚守,长期的根源,我相信到本世纪中叶,中国的科技强国梦,全面强国梦还是会实现的。

  

  大数据是我们这个时代产生了一个新的现象,而这个现象将长期伴随我们存在下去。为什么,我们可以看到人类制造并采集数据的速度,它总是领先于你的处理技术的,所以说我们不断地面临规模超过现有的工具能够获取处理的能力的这么一个数据集,就是说你的计算能力是永远跟不上了。也就是说,大数据现象会长期伴随我们存在下去。

  未来我们每一个人都生活在数据的包围中,你给大家分享两个小故事,就是我们计算机界的两个著名人物。现在回过来看,说明那时的眼光都那么的不对。

  沃森,那个沃森系统就以他命名的,他是IBM的前任主席,也是创始人之一。1941年的时候,他做了一个说法,大概全世界5台计算机就够了。够吗,当时IBM是全世界卖计算机最牛的。

  比尔·盖茨,今年还当选我们中国工程院的外籍院士,这个网上也炒了很久。1981年他说过,640K的内存对所有人应用都够了,现在够吗,我们每一个手机是多少,至少是64吧,64个GB,它是640个KB,什么概念,所以说是长期存在。

  有一个报道,去年美国一个数据管理软件供应商,叫做数据冰山报告,他说当前全球企业存储的数据中52%的数据产生后,就存在着从来没用过,我不知道在座的企业有没有遇到。实际上,我们每一个人都是这样的,你去到一个旅游景点,咔咔咔照相完以后,回家后你们看过吗,整理过吗,几乎没有吧,照的时候特别积极。

  然后还有一个说法,估计一个组织中80%的数据只使用了一次,首次使用以后从此再也不用了,这就是所谓的暗数据现象,就是说大数据长期伴随我们存在,我们根本没有能力处理那么多数据,所以对我们搞计算机的而言,这就是我们的目标,能不能做得到,估计很难,数据量永远是超出这个(处理)能力的。当然我们在这个环节中间怎么样生存好(是个挑战)。

  我讲的就这么多,谢谢大家!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

跟贴 跟贴 0 参与 0
© 1997-2020 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 网站地图 | 意见反馈 | 不良信息举报

娱你同在

娱乐;八卦

头像

娱你同在

娱乐;八卦

120998

篇文章

49915

人关注

列表加载中...
请登录后再关注
x

用户登录

网易通行证/邮箱用户可以直接登录:
忘记密码