略喷网 > 百态 > 正文

​专家:AI时代的统计与数据科学要以解决重大实践课题为导向

2023-07-12 13:48 来源:略喷网 点击:

专家:AI时代的统计与数据科学要以解决重大实践课题为导向

首届全国统计与数据科学联合会议开幕式现场。本文图片均为 澎湃新闻记者 程婷 图

人工智能时代,统计学与数据科学在人工智能(AI)中、尤其是在Chat-GPT中发挥着怎样的作用?统计学者应该怎么做才能发挥学科优势?

7月11日,首届全国统计与数据科学联合会议在北京拉开帷幕,与会的海内外专家学者对这些问题进行了探讨。

AI时代统计与数据科学面临机遇和挑战

会上,专家学者们指出,统计与数据科学是数据资源开发的基石,并已成为现代社会的重要组成部分。随着时代发展,统计与数据科学面临新的机遇与挑战。

北大党委常委、副校长张锦院士指出,当前,信息化进入了新阶段,大数据时代正在全面来临。作为数据资源开发的基石,统计与数据科学也迎来了崭新的发展机遇。经济统计、风险管理、精算学、数理统计、卫生统计、大数据等研究方向的演变,极大地丰富和拓展了统计与数据科学的内涵和外延;在大气治理、机器学习、人工智能、金融经济、医疗卫生等多个领域,统计与数据科学都为解决复杂问题提供了方案,扮演着不可或缺的角色。

“可以说,统计与数据科学,既是学术研究的前沿领域,也越来越成为经济社会发展的重要支柱。”张锦说道。

国务院参事、国家统计局原副局长鲜祖德认为,统计与数据科学,已成为现代社会的重要组成部分,它们在我们的生活中无处不在,从科学研究到政策制定,从经济发展到社会治理,都离不开统计与数据科学的支持。“用数据说话、用数据决策、用数据管理、用数据创新”已蔚然成风。

“在当今的信息时代,数据已经成为一种重要的资源,而统计与数据科学则为数据的收集、处理、分析和解释提供了强大的理论基础和方法。通过这些理论和方法,我们可以更好地挖掘数据中的信息,揭示数据背后的规律和趋势,从而推动科学研究的进步。”鲜祖德强调,统计与数据科学在科学研究和人工智能中很重要。

“国家政策制定需要基于充分的数据分析和研究,才能确保政策的科学性。统计与数据科学可以帮助我们更好地理解社会经济现象,把握市场动态,预测发展趋势,从而为政策制定提供可靠的支持。”鲜祖德指出,在过去的100多年中,普查与抽样调查作为政府统计的两大数据收集方法体系,在对社会经济发展的测量中发挥了重要作用,现在面对更加复杂、更具有不确定性的社会经济问题和大数据等技术的进步,既是挑战也是机遇。

中国人民大学教授、原常务副校长袁卫在回顾统计学科发展历史后指出,新时期,学科体系已经基本理顺,世界也进入了大数据、数字化的新时代,这对统计学科无疑是新的机遇,比如,去年我国在本科统计学类中同时新增了“数据科学”和“生物统计”两个新专业。另一方面,数字时代也带来新的挑战,需要统计学界的年轻人,珍惜当下的大好时光,向统计先贤学习,不忘初心、不断奋进,让统计学科为国家建设和发展作出新的贡献。

中科院数学与系统科学研究院研究员马志明院士也谈到,当前正处于大数据时代,大数据促进了数据科学的发展。在大数据时代,数据科学不仅与统计学有联系,而且与计算机科学、数学、人工智能等学科都有联系,数据科学已发展成为与多学科交叉的独立学科。同时,大数据的海量性质、异构性质、非独立同分布性质等特征也给传统的统计学带来巨大的挑战。

对此,马志明认为,“我们迫切需要发展和创新统计思想和统计理论,建立大数据分析的统计学基础,为数据科学建立严谨的统计分析体系和计算基础。”

首届全国统计与数据科学联合会议论坛环节现场。

统计与数据科学要以解决重大实践课题为导向

身处人工智能时代,与会专家学者们自然而然地谈到了人工智能与统计与数据科学的关系,并不约而同地提到了统计与数据科学要以解决重大实践课题为导向、要在试图解决社会问题的同时提炼统计理论和方法。

在谈及人工智能与统计与数据科学的关系时,鲜祖德表示,“正在兴起的人工智能,依靠海量数据,凭借统计概率等模型,进行深度学习,概率统计和数据科学与人工智能有着直接联系。我认为,没有概率统计理论与方法,没有数据科学,人工智能的智商可能几乎为零。”

西安交通大学教授徐宗本院士在会议中指出,ChatGPT触发了AI大模型浪潮,人工智能研究已经从深度学习时代迈入了大模型(AIGC)时代,从聚焦专用人工智能转向到了通用人工智能。大模型的本质是学习方法论。学习方法论的本质要求是求对数据、网络、损失、算法、任务等要素作一体化的设计和调控。实现这一目标呼唤任务到方法的映照,即学习方法论的掌握(SLeM)),但现有研究/方法论不支持实现这一目标。对此,他提出了SLeM的数学框架、严格定义、数学模型和一般算法,并展示了其在多个机器学习自动化问题上的成功应用。

人工智能时代,统计学者应该怎么做才能发挥学科优势?

在鲜祖德看来,理论再好也要实践,统计与数据科学要以解决重大实践课题为导向,推动科技创新和社会经济发展。而统计与数据科学则是推动连接“产学研”各方的桥梁和纽带。

“通过统计与数据科学的理论和方法,我们可以更好地促进产学研合作,实现科技创新的落地和转化,为社会经济发展提供强大的技术力量。”鲜祖德说。

“经常有人问我什么样的研究是重要的?我的答案一直都是一样的:问题应该来自于社会,在试图解决社会问题的同时把它提炼成为统计理论和方法问题,这样的统计问题永远是重要的。”普林斯顿大学Frederick L.Moore'18冠名金融讲座教授范剑青表示。

范剑青认为,统计学科的发展能否得到社会的承认,关键在于统计学家能否为社会解决它的需求,能否作为一个科学的公使,学会其它学科的语言,把其它学科的问题提炼成为统计问题,在解决统计问题的同时,帮助其它学科解决它们的问题。

“我们的学科应该与时俱进,应该抓住科学发展和社会支持的脉点。以应用为背景,将它提炼成为一个统计问题,用统计的思想解决这个问题,并用其它学科的语言,把我们的成果反馈给社会,这样的学科是一个完美的统计与数据科学。”范剑青说,不管统计学家是否参与,统计科学都会随着社会的需求和人工智能的发展而不断前进,关键是统计学家能否把住目前的机遇。

澎湃新闻从会议现场了解到,首届全国统计与数据科学联合会议于7月11日-13日在北京会议中心举办。该会议由中国现场统计研究会、概率统计学会、全国工业统计学教学研究会和中国商业统计学会联合发起,北京大学统计科学中心承办,旨在为学术界、工业界和政府机构的统计人员提供一个学术交流、探索合作与人才招聘的平台,推动国内统计与数据科学领域的大力发展。

本届联合会议涵盖近400个学术报告,约1650名与会者到场。参会人员包括海内外300余所高等院校统计与数据科学学者、在校学生及部分业界代表等。会议包括大会报告、邀请报告、贡献报告、研讨会、招待会、联谊会、人才招聘等活动。