财新传媒 财新传媒

阅读:0
听报道

最近,新基建的概念非常火爆,因为期盼已经望眼欲穿,大家都希望看到中国也能出现一套令人振奋的经济刺激方案,重启中国经济,让中国重新登上一个说得过去的经济增长水平,让大家看到希望,也能振奋人心。不过,新基建的概念推出之后,应该说不少人的心就凉了半截。因为新基建的范畴,主要焦点集中在5G和信息技术方面,如大数据、人工智能之类的,这些富含科技营养的建设内容与大多数人的生活无关,与大多数的生产活动无关。当然兴奋的群体也有,所谓高科技群体可能就很高兴,因为对他们来说,欢呼投资家们回归的可能性又大了几分,这意味着可以支撑他们把科技游戏继续玩下去。而且更重要的是,这还不用国家投资,只需要市场投资、甚至是风险投资就可以了。

大概是从“十八大”之后,强调数据驱动和高科技,渐渐成为了中国经济发展的主导言论,技治主义在中国的味道日益浓厚,这在表面看似乎是一种科学精神的体现,其实并不尽然。客观的来讲,科学及其科学的进步,实际是富国的一种消费,就像艺术品总是富人的消费一样。科学当然也会有巨大贡献,但那是科技真的搞成了之后,实际上穷国和穷人是搞不来科学的,因为没钱,所有的科学都需要大量的资金支持,更会有大量的资金空耗和落空。科学界中实事求是的“骗子”,远比基层社会多得多。他们倒不是存心欺骗,而是科学的认识永远是渐进的,成就者终究是少数,牛顿只有一个,大多数都变成了似是而非的东西,当然豁上去的钱,也就落空了。

科学、数据、高科技与社会繁荣究竟是一种什么关系?这是一个值得探究的问题,答案并非像人们想象的那么简单!尤其是简单到就是致富之路、发财之路,这样的想法,应该说太纯洁,也太苍白,完全不切实际。

疫情之下,美国有一位忍无可忍的学者(Carl Bergstrom)写文章批评说,现在的病毒疫情暴露出太多的“胡说八道”,尤其是美国的科学界和新闻舆论中到处充斥着“胡说八道”。他说的一点都没错。科学并非是只有数据就可以了,还要看数据的运用是否科学,更重要的是看人,看社会发展,看政治的需要。

这位毕业与哈佛大学和斯坦福大学写过《Calling bullshit》一书的美国学者指出,现在的世界变得越来越量化,观点的研究讨论已经基本变成了统计学的论证,无人关心事实,越来越多的人关心的只是数字和模型等,即使在大众媒体中,我们也越来越面临数字论和统计论。他认为,这样的数据崇拜是非常荒谬的,当森林大火开始燃烧并且靠近你的时候,难道你感兴趣的仅是森林的面积数据?100英亩的森林,还是数百万平方英里的国家森林在燃烧?

其实,数学模型没有你想象的那般科学。受过科学训练的人都知道,每一个数学模型,都是有假设条件的,每一个发现、每一个结论都是可以轻易修正的,而且非常简单,只要增加一个方向或减少另一个方向的证据权重,就能做到并且轻易实现。

今年3月份,英国帝国理工学院在世界上出尽了风头,因为他们公布的模型,被世界新闻界广泛报道。帝国理工学院的第一个模型预测,如果不控制这种流行病,美国人的死亡人数将达到110万至220万人。这是一个非常恐怖的戏剧性数据。美国新闻界一哄而起,众多讨论都围绕这个数据进行,美国的党派分歧也极大的促进了这种现象。然而,帝国理工学院后来又再度回来了,并为完全不同的情况建模,他们新的模型结果显示,在美国,如果这种疾病得到了控制和抑制,那么他们随后的模型数据是:“如果这样做,将发生约50000人的死亡”。这下子美国新闻界和评论家们彻底晕了(中国其实也一样),大家都纷纷指责帝国理工学院:几个星期前,他们的模型说要死一百万人,现在他们的模型又说要死五万人,简直就是“胡说八道”!其实正确的答案是,他们只是根据两个不同的情景进行建模,同样的事情,模型就会产生两种结果,关键就看你怎么运用模型。

现在科学界常见的现象是,如果有人用数学模型做预测,写出来的论文通常很难见到有半页纸是关于预测局限性的介绍和讨论,大家论述、介绍的都是希望正确的一面。在中国,基于理论研究和数学模型写出来的论文和文章,所面向的认真读者,幸运的话,不超过100个人;在美国,同样的情况下,面对的认真读者,大多数时候可能也不超过500人。这些认真读者与我们这样的研究者,背景非常相似,拥有大量共同假设和相关知识,受过类似的科学训练,能够理解这些复杂的科学知识。问题是,并非所有人都拥有这样的科学知识,并非所有人都经过类似的科学训练,一旦需要面对这样的大批人群和受众的时候,那结果肯定就是一团糟。大多数显而易见的结果是,要么是假装明白了,要么就是视而不见。

这是真实的情景吗?

现在的疫情,尤其是现在社会对于疫情的反应,就是一个充分可证明的例子。要正确理解现在的预测,正确分辨疫情中的阳性和阴性,就必须理解正预测值的概念以及检测误报和误报错误率对预测结果的影响方式,而这取决于人群中感染的发生率。

事实是,如果测试错误率是3%,并且总体发生率低于3%,那么得到的大多数阳性结果都是假阳性。简单点给予解释,社会群体就是一个混淆矩阵,对病例的检测,是一种典型的分类任务,要分开阳性与阴性的群体,如果总样本的比例非常小,出来的结果随随便便都是阳性的,当然其中假阳性的比例就会非常高了。中国有14亿的人口规模,5%的人口就是7500多万人,这其中能检测到的总样本人数又能是多少?总样本人数非常少,试剂盒的标准又不一致,这就会导致现在所谓“无症状阳性患者”的突然大增。归根结底,其实仅仅是因为对数据科学不理解造成的问题,大家忙来忙去,叫苦连天,直至声震宇宙,但忙的竟然就是一场数学游戏。我们反复强调和呼吁,中国政府一定要强烈关注并尽快确保试剂盒标准统一的原因也在于此。

其实,不仅仅在中国,美国的情况也差不多,美国科学界迄今为止并未对控制疫情提供多大的直接帮助,也许将来在药物和疫苗方面能够实现这种贡献,但至少现在还没有。现在更多的是各国政治家几乎是在凭直觉控制疫情,而且还取得了不错的成就,因为大多数国家毕竟已经控制住了传染局面。Carl Bergstrom在文章中也曾经指出过美国的一个例子,纽约市的一项研究显示血清学检测阳性的人占比高达21%,这是一个吓死人的数据,也的确吓坏了美国舆论界,但其实这同样也是统计学认识不严谨造成的错误。

现实就是这样的现实。

现实与未来是接轨的,一个国家按照数据驱动的模式向前发展,根据数据论和统计论向前发展,将国家的发展期望,将好不容易推出的、攸关国家未来命运的新基建,寄托于数据驱动的基础上,这在中国并不现实。

科学训练没有速成班。中国的人口素质包括数据过去已经讲过太多、太多了,数亿小学文化程度的人,直奔数据科学而去,直奔新基建而去,这样荒唐的科学乌托邦情景,不应该出现在中国。新基建的世界,基本就是一个科学乌托邦的世界。情景犹如富丽堂皇的梦想,包含了5G,大数据,人工智能等等新概念,但所有这些事情,只是与我们这个14亿人口大国中的小部分人工作有关,他们也许能因此发财致富,而大多数人的工作与此无关,而且还很可能被迫稀里糊涂的掏钱买单。事实上现在的中国,大多数人连基本的逻辑训练都严重缺乏,连话都听不明白,辨理都靠胡搅蛮缠,怎么可能掌握数据论和统计论中的内容?如何能靠数据进行理性思维?如何明白混淆矩阵和分类任务?中国的未来经济,不可能因为少数人有好工作而大多数人没有好工作而走向繁荣。

中国的电商繁荣同样也富有这样的乌托邦色彩,电商的销售额虽然有1.36万亿美元,看似高居世界第一,但这是以挤占传统消费为代价的,总消费并未提升,2012年后消费在GDP占比的提高,原因是中国经济增长中另外“两驾马车”的下降而被托高;年轻人的购买行为和消费同样如此,那是由于挤占了中国老龄人口的消费,而呈现的虚假繁荣。繁荣总是有代价的,虚假的繁荣,代价更高。

中国是一个大国,我们需要严肃认真的发展精神。过去的中国是这样,所以我们发展起来,现在也不能丢掉严肃认真的发展精神,必须脚踏实地工作,中国才能走向真正的繁荣。

最终分析结论(Final Analysis Conclusion):

中国是人口众多、教育差别大、区域差异显著的大国,中国经济的发展不能按照数据驱动的模式发展,相信科学、发展科技,并不代表着中国要走科学乌托邦的道路。

话题:



0

推荐

陈功

陈功

85篇文章 2年前更新

我是一位,没拿过特殊津贴的专家,之所以称为是“专家”,只是因为确实做了一辈子。我完全自学成才,跟任何中国的大学都没有关系,今后也不会有关系。我没有学生,也不靠学生关系。 我没有任何官方职务,立场完全中立。写过几本小书,每个字都是自己写的。没有得到过任何官方的资助和支持,但确实得到过大量官方资金。办法就两个,一个是拿知识劳动来交换,真有用的东西,自然有人拿钱来换,官方和企业都一样;另一个是每天只睡几小时,几十年如一日,做牛做马做出来的。 我只做一件事,就是现在的事情。

文章