石勇大数据与数字经济

琛ラ鑴傛敞灏勬恫浠锋牸 https://m-mip.39.net/baidianfeng/mipso_4325480.html

5月7日,“城市之光——超级App蝶变与未来”首届中国城市超级App生态协作峰会在中国无锡隆重召开,此次会议由无锡市大数据管理局和中国城市超级App联盟(筹)联合主办,浙江国脉数联网络有限公司、灵锡互联网(无锡)有限公司、交通银行股份有限公司、无锡数字经济研究院承办。大会涵盖 行业解读、标准文件发布、实践案例分享、未来趋势思辨等重要议题,参会大咖分享研究成果、交流智慧观点、探讨未来发展。大会异彩纷呈、盛况空前,共有余位嘉宾出席本次会议,其中有来自上海、南京、厦门、南宁、深圳、株洲、黄山、连云港、驻马店等43个城市代表出席,更有余人同步收看线上直播,共同见证城市超级App迈入协同发展新时代,点亮城市未来之光。

本文系国务院参事、发展中国家科学院院士、中科院博士生导师石勇先生于5月7日上午在“首届中国城市超级App生态协作峰会”主题论坛上的演讲,内容通过现场速记整理,未经本人审核。

「国务院参事、发展中国家科学院院士、中科院博士生导师石勇」

首先,对杨董、各位同事,包括胡书记的邀请表示感谢,同时也热烈祝贺中国城市超级App联盟筹办成功。

先给大家讲个故事,年我去美国读博士时做数据分析,当时的数据分析非常简单,只有两个软件:一个是比尔盖茨公司做的BASIC软件;第二个是我们非常 的SAS公司做的软件,只能分析N=50的数据,通常过去是用手算的,N=20就有统计综合性。当时用N=50的数据来描述一个物品就相当于画了个素描,简单又没有新意。三十多年过去了,现在我们可以用成千上万的数据来刻画一个物品,App也是如此,这是时代的飞跃。前几年我回到母校去做报告,有个心理学老师说,我们过去的看法不对,数据分析改变了整个世界,现在管理心理学做调查报告也要靠大数据,这是一个飞跃的发展。

今天与大家分享的是大数据与数字经济。当一个新的事物出现时,一定不要忘记基本原理(科学原理)。首先申明,今天讲的任何内容代表我自己,不代表任何单位,包括国务院参事。

一、数字经济的基本概念

数字经济是大数据全面应用。十三五规划的时候讲大数据、国家战略,到了十四五规划数字经济占主要内容,它是大数据的全面应用。“数字经济”到目前为止没有统一的认识,百度的定义:数字经济是人类通过大数据(数字化的知识与信息)的识别—选择—过滤—存储—使用,引导、实现资源的快速优化配置与再生、实现经济高质量发展的经济形态。百度的定义也不是完整的。我们通过大数据的应用产生新的业态,高速发展经济,这是数字经济的主要含义。去年李克强总理在政府工作报告上讲到数字经济的重要意义:打造数字经济新优势。今年更多提到的是要加快数字化发展,打造数字经济新优势,协同推进数字产业化和产业数字化转型,加快数字社会建设步伐,提高数字政府建设水平,营造良好数字生态,建设数字中国。

无锡是物联网产生的地方。不管物联网、云计算,甚至是量子计算、光子计算,都是技术手段,但是有两个东西是纲举目张的东西:一是大数据,没有大数据,无米之炊;二是算法,没有算法,不能产生任何价值。到目前为止大数据的定义,是大型、多样、复杂、纵向,或基于仪器、传感器、互联网交易、电子邮件、视频和点击流等产生的分布式数据集,或基于所有现在和未来可用的其他数字源。这是美国国家科学基金会年给出的定义, 一句话非常清楚,现在和未来的任何可用的数字源。

二、大数据的重要性

用一张卡通图,几乎把大数据刻画得淋漓尽致。一个客户寻求服务,他把信息告诉工作人员,工作人员通过大数据系统演算。 个层面,工作人员几秒钟之后马上就说了一句话:根据亚马逊的交易记录、网上的记录、政府的记录、网络与开源数据的记录,这就是大数据三个来源:(1)企业;(2)网络与开源数据;(3)政府。第二个层面,通过精确分析,发现你在我们这里的受欢迎程度只有23.5%,不是23%也不是24%而是23.5%,表示分析一定是精确的, 分析大数据需要通过挖掘才能得到支持。第三个层面,通常我们认为客户到任何地方寻求服务,他就是上帝,但如果客户的关系成本很低,他就不是上帝,不需要给他提供服务,所以工作人员跟客户讲:你可以离开了,我给你服务后没有价值。我们面临改变管理决策机构的大数据问题。

三、我国的大数据战略

我国从年到年在北京连续组织了3次香山工作会议,香山会议是科学会议,而且结果一定要给中央写报告的,这是后来我们产生大数据国家战略的情况。我们给中央写了两份报告,一是关于网络安全,习主席批示了多个字,到了十一月份就成立中共中央网络与信息安全领导小组。当时关于大数据的国家战略,领导交给发改委主任,专家讨论一年多时间,在年年前做出了大数据行动纲领、大数据国家战略。我想跟大家分享一个最重要的定义:大数据是数字化生存时代的新型战略资源,是驱动创新的重要因素,正在改变人类的生产和生活方式。

十三五规划是大数据国家战略深入规划的开始,主要的想法是通过六个部分去做大数据: ,大数据高效采集、有效整合,深化政府数据和社会数据关联分析、融合利用,提高宏观调控、市场监管、社会治理、公共服务 性和有效性;第二,依托政府数据统一共享交换平台,加快推进跨部门数据资源共享共用。加快建设国家政府数据统一开放平台,推动政府信息系统和公共数据互联,开放共享;第三,研究制定数据开放、保护等法律法规,制定政府信息资源管理办法;第四,深化大数据在各行业的创新应用,探索与传统产业协同发展新业态新模式,加快完善大数据产业链;第五,加快海量数据采集、存储、清洗、分析发掘、可视化、安全与隐私保护等领域关键技术攻关;第六,促进大数据软、硬件产品发展,完善大数据产业公共服务支撑体系和生态体系,加强标准体系和质量技术基础建设。

建设政府数据统一交换平台这一重要工作已经由国家信息中心完成了。为了让国外的人士了解我们中国在干什么,年我们和发改委同志一起写了一篇文章——《中国在大数据上做了什么工作》,总结为“1-3-10-19战略”,1即1个顶层设计,3即3个主要国家平台: 是政府部门共享平台,现已开放,每个人都享受到了平台的好处,比如手机报税、公安应用等;第二是因特网服务平台;第三是政府数据开放平台,现在政府按照任务清单的方式在高速收集数据,将来对我们城市App的发展有借鉴作用。

四、经济发展与数据分析

我们的数据是分析化大数据,实际上人类在分析数据的历史上只有多年。开始用统计学,科学化分析数据。统计学是从外面形象的方式去分析,未深入到数据内部。有些人说前几年是人工智能元年,其实根本没有元年,人工智能的岁数比我们都大,它是按 步、第二步、第三步这样发展的。到了上世纪50年代,我们开始用数据分析的方法,至今已使用超过60年。但是这两种方法都是基于结构化数据做出来的,用数据化方法将成千上万的图片、图像、遥感数据、文本在短时间内分析出结果是非常困难的。目前真正基于分析法的数据化解方法还没有,这是我们要探讨的事情。

如果从人类分析数据的历史来看,我们要记着这样一个伟大的科学家,理查德·普莱斯,这是他在年发表的文章,每一行都是英国人交税的记录,我们叫变量。

如果把每一行改成成千上万的行,每一列改成成千上万的列,这就是大数据,若把中间每个符号改成文本图像,那更是大数据。现在分析的结果仍然以此为基础。

五、数据挖掘

(一)数据挖掘的数学工具

在数学工具中统计、决策树、神经元、模糊逻辑、数学规划,统计是 位,神经元就是DeapLearning,即深度学习,最经典的是数学规划。

(二)多目标、 化数据挖掘方法原理

这个图像左边的圈是 组,右边圈是第二组,中间这条线叫 。数据分析(数据挖掘)就是把数据之间“你中有我、我中有你”的情况分开来。超过中线的点缩小化,使它重叠最小,其他的点到边界越大越好,即要寻求最小的α, 的β,把这个圈中的点靠左边的往左边拉,靠右边的往右边拉,把中间分析不开的分析开。但是数学模型不能彻底解决这个问题,最多只能做到90%分析数据化,不能彻底分开。换句话讲,现在说的数字孪生绝不可能%像,但是一定有90%左右像。

(三)数据挖掘的三个基本想法

一是数据画面本身,不管做什么App,都希望它能用一个数学问题就解决,比如寻求高端客户, 步根据导向性结果找数据;第二步通过数据转换,不管什么数据,三维、四维要变成一维或者二维,维数要一致,否则不能运算,这是整理数据的艰苦过程;第三阶段是挖掘,数据挖掘完后支持与否,因人而异、因时而异,需要决策者自己处理。

二是学习的原理,当我们给定数据集后,周而复始地确定哪部分学习,哪部分验证、训练,再进行应用。要好好考虑App重新学习数据后的应用标准制定时间段。举个例子,股票是每天下午收盘以后就学习明天的机会,信用卡是每三个月学习一次。找出这个原理, 定出App需要学习多久。

三是智能知识,数学先是数据化(一阶问题),数据化后还有二阶问题,要用数学模型把决策者的思维方式总结起来放进去,再重新过滤,这就是数据管理。过去大家只考虑量的变化(一阶问题),没考虑质的变化。四年前,发改委做国家大数据技术平台,专门提到数据挖掘一定要找到自身知识并结合实用。

六、大数据分析的挑战问题

现在面临三大挑战,大家对大数据要有科学的认识。 ,大数据应该既要全体,又要抽样,大数据的抽样比小数据的抽样更具有普适性。大数据不是分析所有数据,而是分析大量的数据,分析的数据越多越好。第二,大数据应从粗糙中寻求精确。第三,大数据寻求因果关系,而不是相关关系。

在以往发表的《大数据三个技术问题》演讲中提到:

,分析工具不足以分析真正的大数据,只能把非结构化数据转化成结构数据进行分析。比如将图片导成数据,将图片的内容、结构等结构性的东西转变成数字。

第二,瞎子摸象。如果大数据是做石油的结构分析,只能分析一个坡面,转20度坡面又不一样,那么把两个不同的角度结合起来,通常比现在用的媒体数据还要复杂。

第三,数据有结构化数据、半结构化数据和分析化数据,决策也是这样,有结构性决策、半结构性决策和分析化决策。比如你刚刚参加工作,写的报告就是结构性的;给经理批了几个字,这是半结构性;给了老板CEO,这就是非结构性。

十三五规划是大数据起端,但其中提到更多的是数字经济,也提到数字城市、智慧城市,后成为十四五规划,为了实现年远景目标。从社会的方方面面讲大数据应用,包括国际共同体问题,都是数字经济。所以创办城市超级App是有好处的。假如中国标准出来了,将可以让世界其他国家借鉴,在某个领域上有自己的领导地位是非常有意义的。

七、我国大数据(数字政务建设)的进展

从十八大开始,特别是十九大,基本完成政府数据归一化,其中有三点非常清楚,一是网络通,二是数据通,三是业务通。网络通是建立统一的平台——国家数据中心平台,62个中央部门、32个地方部门、城市市区包括新基建等全部统一。但是现存问题是高速公路有了,上面跑的车太少,国家层面做的时候比较困难,是否可以到省一级层面做。最近还提议把一体化大数据中心平台从国家平台重点放在建立市级城市平台上(长三角区、粤港澳大湾区、京津冀和成渝双城),能否把它们的一体化平台建设出来,这是我们App需要考虑的。业务通,包括依靠App做的最多跑一次等各种各样的应用,都是我们国家的发展。

从这个角度看,我们国家的发展已经 世界,年我们就发布大数据全球报告,今年发布第二次报告,我们惊人地发现数据开放非常重要。一个国家的经济发展,GDP成长跟数据开放是成正比的,这就鼓励中国政府一定要开放速度。中国在经济和金融业的数据开放不错,但在工业方面差一些。

八、大数据与数字经济案例

(一)中国个人信用评分系统

年我在美国给中央写信,中国将来应该发展信用经济成为信用社会,首先要重视资信评分。回到中国工作以后,06年到09年,我们做出了人民银行征信,影响了在座的每个人。到银行去贷款,商业银行都要到央行征信中心去调用个人征信记录,征信评分就是对每个人的模拟运算,非常精确,精确度超出美国系统12%。在座每位在银行取款的数据,人民银行都有信息,实时且清楚,目前这些信息还没有开放给地方,存在一定困难,因为面向金融系统不开放,仅有个别商业银行开放,将来可能会扩大。谁需要使用数据,只要按照条件、法律就可以进行。我们做的非常好的原因有两个,一是中国的数据非常完整,比美国完整;二是我们用的工具,比当时在美国用的还要先进。例如美国的次级贷款,要是中国没有这样一个利器就不可能避免金融风暴。美国08年 次使用信用评分,金融风暴立刻就截止了。原理很简单,当金融风暴产生后,它从上到下、从里到外、从底层开始截止,只要发现破产行为,信用分低于分,立刻就把财产没收。将来我们可以使用这个武器作为 保证,避免中国发生同样情况。

大家可以看(下图),这是美国的分布,2%、5%、8%都属于有问题,是次级贷款。中国叫泊松分布,通常活跃度分数应该在分左右才是正常的。人民银行对我们的评价是远远超过国际水平。中国也可以用自己的力量作出 的功能。

(二)疫情防控与复工

去年2月7日我们做了 个模型:武汉模型。当时大家还在疫情影响的水深火热之中,我们就把武汉模型做出来了,告诉领导武汉什么时候可以复工、复产。例如,武汉3月1日复工,那时候还有多少病例,但GDP可以抢回来比较多;3月10日复工,GDP减少,病例减少,但社会比较安定等之类的利弊分析。紧接着到2月12日、13日,北京模型、天津模型、杭州模型、苏州模型和深圳模型做出来,给中央写了报告,总理和几个副总理马上做了批示。去年5月1日我们在非常 的《Cell》杂志上面发表英文评论把成果贡献给社会,震动了整个世界,所以利弊分析是非常重要的。另一个例子,我们把大数据的元素加到传统传染病模型中去,医院时,我们要考虑它是七种人群中间的哪一种人群,五种场所的哪一种场所,结合社会数据。数据分享可以完全用来掌握经济变化,以及疾病的监控。

(三)商业系统应用

现在投资的平台都有 性,这就是当年的双创指数。路透社、彭博社还发表文章《中国的双创活动,三箭齐发》,其中双创指国家指数和我们做的指数,后来成立了商业应用平台,在纳斯达克上市。

(四)春雨医生

春雨医生App的应用就是假设已经发现了病灶,通过这个App,马上就可以找到你需要的医生。举个例子,前年在我老家湖南,进入手机马上就能连线北医三院的医生,跟山村里七十多岁的老太太直接对话。老太太在App中输入病灶,通过算法立刻找到医生进行电话咨询。这就是IT带来的变化,也是App带来的变化。

(五)中国金融期货交易所

年世界计算机科学家大会在无锡举办,当时超算“太湖之光”还是 。我们把上海金融期货交易中心的数据用到无锡来计算中国期货衍生品的变化。这是用超级计算机来计算股票市场和金融市场数据的 例。

九、大数据与人工智能:数字经济的未来

年我建议:用刻画人智商的方式刻画机器。到年MIT技术评论:人类找到一个简单方法——用智商的方式刻画机器。人工智能在发展,何时发展得比人还聪明,这个路程非常重要。我的学生还用智商的办法、按照人类社会的反应刻画智慧城市,跟大家讲的标准完全不一样,这是个创新工程。

十、我们的未来

未来一定是大数据+算法,其他包括5G、区块链都是属于变化的技术。我们首先要打造的是大数据社会,有了它以后,十四五规划目标,包括年的研究规划都可能实现,实际上,人类对社会的发展助力非常渺小。发展到目前程度,就是因为莱布尼茨创造了二进制。年前他创造时,文章不能发表,后来他发现二进制的概念与中国的64卦(阴阳对卦)是一样的,当发现这个概念以后他就用阴阳64卦把二进制排列,随后文章顺利发表。

若这个东方和西方文明的结晶——二进制没有发表,就没有今天的计算机。文章发表年后,有了布尔代数,到了上个世纪,我们产生图灵机,这就是计算机的产生历史。人类找准方法,把复杂的问题简单化,把复杂的社会变成0和1,包括量子计算也是0和1。但还有个问题,变成0和1以后会遇到瓶颈。例如AlphaGo,人类下围棋完全不如机器人,整个棋盘变异,还没有下围棋就输掉,不管谁下的。它把所有的结构都变异,这是由于计算机的高超、简单、来的快、没有选择,但是如果我们打麻将,三个人和一个机器,不管机器是量子计算机还是光子计算机,它都一定输掉。我给对方递个眼色,没有任何机器能够计算人的眼色,包括X光,完全不能刻画无穷的复杂性。只有把计算机变成多次阶段后,才有可能达到这种境界,让这个机器更加聪明,让App更加聪明,能够解决大部分的事情。

人类的发展是一个长期的过程,0年以后回头看这个时代,人类做了什么?这就是我们做的事,这是社会的经历。

关于我们

国脉数联主要提供App咨询、规划、评估等研究和运营等综合解决方案。全国 推出《城市超级App技术要求和服务规范》标准文件及城市超级App评估指标体系,通过分析研究汇聚城市级App竞品分析+,运营推广汇编,应用场景汇编,头部App运营跟踪报告,商业模式汇编等。

预览时标签不可点收录于话题#个上一篇下一篇


转载请注明:http://www.qzhongz.com/nzzd/7914.html