北美知名大学数据科学专业课程体系分析

    孙书韬 朱立谷 李春芳

    

    

    

    摘 要:数据科学与大数据技术人才培养受到国家的高度重视,我国已经有近480所高校开设了数据科学与大数据技术专业。文章分析了北美知名高校数据科学专业设置的特点、数据科学专业课程设置体系结构及不同高校的课程设置特色,对我国高校数据科学与大数据技术专业课程设置与教学内容的建设提出了积极建议。

    关键词:数据科学;课程体系;北美高校

    中图分类号:G642.3 ? ? ? ?文献标志码:A? ? ? ? ? 文章编号:1673-8454(2019)24-0048-03

    一、引言

    当前,社会媒体以及各种社会和经济活动每天都在产生海量的数据,对这些数据进行充分的利用,基于大数据进行决策分析、个性化服务、建立人工智能系统等,有着广阔的应用前景。大数据技术受到国家和工业界的高度重视,市场对于大数据人才的需求日益增多,许多高校顺应技术潮流和市场需求,开设了大数据技术的相关课程,部分高校建立起了数据科学与大数据技术专业。从2016年2月教育部批准北京大学、对外经济贸易大学、中南大学等开设数据科学与大数据技术专业起,截至目前我国共有近480所高校获批设立该专业。

    大数据技术包含大数据的采集、存储、处理分析与应用。从知识支撑角度看,数据科学与大数据技术专业涉及传统的数学、统计科学、计算机科学与工程专业知识。但数据科学与大数据技术专业又派生出许多针对海量数据处理和面向不同应用学科的特定知识, 出现了面向大数据处理的许多新的技术、方法和平台。

    如何设置数据科学与大数据技术核心课程和开展教学,是高等学校这一年轻专业亟需解决的问题,国内高校根据自身的特点进行了许多有益的探索。李莎莎等分析了数据科学与大数据人才专业课程体系, 给出了北京大学、复旦大学、中南大学、美国旧金山大学和英国华威大学数据科学专业开设课程的合集,并分析了各部分课程所占用的比重[1]。崔燕探讨了面向大数据分析的信息管理实践教学体系[2],偏向于计算机技术基础知识与大数据处理平台的建立与使用。许安见、邹杨等探讨了数据科学与大数据技术专业培养方案[3]。

    本文收集整理了美国加州大学伯克利分校、麻省理工学院、斯坦福大学以及加拿大滑铁卢大学等北美四所知名高校数据科学与大数据技术相关专业设置与专业要求以及课程设置情况,分析了该专业和课程设置的特点,对我国数据科学与大数据技术专业建设提出了相关建议。

    二、北美知名大学数据科学相关课程设置

    1.典型大学专业设置与课业要求

    北美相关专业设置一般不叫数据科学与大数据技术专业,主流的专业名称为数据科学(Data Science), 设置数据科学的教学单位一般为计算机、数学、统计、文理学院等学院或系。麻省理工学院将相关专业命名为计算机科学、经济与数据科学(Computer Science, Economics, and Data Science)。

    加州大学伯克利分校数据科学专业设在文理学院,除了要求学生的数理和计算机科学基础外,还要求学生在文学艺术(Arts and Literature)、生物科学(Biological Science)、历史研究(Historical Studies)、国际研究(International Studies)、哲学和价值观(Philosophy and Values)、物理科学(Physical Science)、社会与行为科学(Social and Behavioral Sciences)等7个方向,每个方向选择一门课程,满足知识宽广度的要求。在此基础上,在高阶课程阶段还需要专门在选定的方向上学习两门深度要求的课程。表1给出了该校的数据科学专业课程设置和要求[4]。

    麻省理工学院设置了“计算机科学、经济与数据科学”专业[5],可能是考虑到数据科学本身还不足以支撑一个专业或考虑到数据科学要与具体应用相结合。事实上,许多国外知名高校没有设置数据科学专业,但一些学校设置了数据科学的辅修(Minor)。表2给出了麻省理工学院相关专业的课程学习要求。

    从麻省理工学院的课程设置可以看出,学校也比较注重人文艺术和基础科学的通识教育,但与加州大学伯克利分校相比,给学生提供的深度方向选择指定了经济类。和加州大学伯克利分校一样,学生可以在7个领域自行确定自己感兴趣的数据科学结合的领域应用。从上述两所北美顶级名校的课程设置来看,二者都十分重视基础理论的教育。同时也提供了一定数量的选修课,使学生可以发挥自己的兴趣,培养某一方面的专长。

    斯坦福大学在硕士阶段設置了数据科学项目,但在本科阶段没有设置专门的数据科学专业。统计系提供了数据科学的辅修模块(Minor)[6],目的是为人文与计算科学学院(Humatical and Computational Science)各专业提供感兴趣领域的统计数据分析方法。数据科学辅修专业要求完成线性代数、程序设计、R程序设计、数据科学、统计、数据挖掘与分析、领域相关的数据科学方法论等7门相关课程。这7门相关课程除了2门是只有一个课程供选择外,其他都提供了多于一门的课程供选择。

    北美信息学科教育另一所具有代表性的学校是加拿大的滑铁卢大学 ,它是以进行多次强制性实习(Coop)的项目而出名的,实习极大地提高了学生的就业能力。加拿大大学的本科专业设置与国内略有不同。在教学中提供了职业专家(Professional specialist)、主修(Major)、辅修(Minor)几类教学体系。其本科毕业要求一般要学30余门课,这可以由一个Professional specialist课程组支持,也可以由两个Major课程组或一个Major、两个Minor课程组支持。Major约16门课程,Minor约8门课程。滑铁卢大学也开设了本科数据科学专业,学生申请滑铁卢大学的计算机科学或统计项目,在学习计算机科学或统计时, 可以选择数据科学专业方向(Major)的学位,所以其专业设置在计算机科学与统计方面的课程设置较多[7]。但其毕业要求中也要求学生修学一定的广度课程和在除计算机科学和统计之外的其他专业的某一个领域修习几门课程,达到一定的深度,这点与美国高校要求类似,但从课程比例上来看,分量不如美国的顶尖高校重,具体见表3。

    2.北美知名高校数据科学专业课分类

    综合北美知名高校的课程设置,可以看出数据科学的课程群主要包括以下几个部分:

    (1)数学基础课。包括基础课程:微积分、线性代数、概率论、统计、概率与随机变量、最优化方法、计算机科学的数学等。高阶课程:随机过程、线性建模理论与应用、时间序列导论、实验设计与分析、再生与协同统计数据科学等。

    (2)计算机相关课程。包括基础课程:计算机科学导论、Python编程、程序设计基础、计算机程序结构与解析、算法导论、算法设计与分析、网络。高阶课程:计算机安全、操作系统、程序设计语言与编译、Internet导论、软件工程、数据库导论、人工智能导论、自然语言处理、信号处理、可视化与理解神经网络等。

    (3)数据科学相关课程。包括数据科学导论、机器学习、数据科学中的计算结构、数据挖掘与分析、数据可视化导论、现代统计预测与机器学习、数据的人文与伦理、社会生活计算、数据科学伦理问题等。

    (4)领域相关课程。这是以UC Berkelev为标志的学校强调的课程设置。这部分课程丰富多彩,一般每个领域都会提供几门低阶课程供学生选择,满足宽广度的基本要求,另外还会提供10门左右的课程供数据科学专业的学生选择,来满足某一领域深入学习的要求。这些课程加起来约有上百门,给学生提供了充分的选择余地。其他学校也有类似的要求。

    上述课程设置并不会要求所有课程都需要学习,学生可以根据兴趣和自身特点在课程群内部做出选择,只要修够一定的学分即可。在顶级学府中,更强调数据科学与领域知识的结合,这样数据科学的毕业生毕业时就具有了在某一个领域从事数据分析工作的能力。

    三、国外知名高校与我国数据科学与大数据技术专业教学的比较分析与建议

    1.强调学生知识的宽广度与某一非专业学科的深度

    上述高校都强调数据科学专业毕业生的知识体系要保持一定的宽广度和某一特定领域的深度。一般情况下在某一特定学科要选修4门以上课程。麻省理工学院要深入学习经济类课程,其他两所院校比较灵活,学生自己选择一个专业进行深入学习。通过这种机制,使学生掌握特定领域的知识和数据分析技术,能够增强就业市场上的竞争力,也能增加以后转移到其他领域的经验。对比我国高校给出的课程设置[1],可以看出除了经济类选修课程较多,我国各高校数据科学与大数据技术专业并没有给学生提供很多的领域课程进行学习,面向行业的大数据人才培养特色并不突出。

    2.注重学生综合能力的培养

    所有学校都要求学生选择一定的人文类课程,这其中不仅有历史、文化等,还有一类重要课程是培养学生的交流能力,包括写作、人际交流、公共演说、跨文化交流、领导力、冲突管理等等。这些课程对于学生走向社会后的成长具有十分重要的作用。国内该课程设置中对学生的交流能力培养不是很充分。

    3.大数据特色国内外的侧重有所不同

    国内高校将相关专业定位为数据科学与大数据技术专业,在课程设置中开设了一些大数据平台相关的课程,如Hadoop编程、Hive编程、大数据系统应用实验等,相当比例课程以大数据为名称来命名。在国外的几所高校中,很少有以某一平台或语言名称命名的课程。课程还是以技术为统领,平台和语言是技术实现的依托或案例。上述国外高校纯编程语言课程的教学很少,学生需要在课程实践或实习中具备较强的自学编程语言的能力和使用大数据平台的能力。

    四、结语

    数据科学与大数据技术专业作为一个新兴学科在我国得到了长足的发展,与国外相比,我们在顺应社会对数据处理和分析人才需求方面的进步非常迅速,具有自己鲜明的办学特色。我国的数据科学与大数据技术专业学生的培养在与领域和行业结合上、在综合能力的培养上,与国外知名高校相比还存在一定的差距。如何改进课程设置体系,夯实基础,增加学生的选择范围,使学生在掌握数据科学与大数据技术专业所需的计算机科学与数理统计核心知识的基础上,在本科阶段就完全具备从事某一领域与行业数据相关的科学研究与工程开发能力,是我国数据科学与大数据技术专业培养的重点的努力方向之一。

    参考文献:

    [1]李莎莎,周竞文,唐晋韬,等.数据科学与大数据人才专业课程体系分析[J].计算机工程与科学,2018,40(S1):109-113.

    [2]崔燕.面向大数据分析的信息管理实践教学体系构建[J].课程教育研究,2017(18):21-23.

    [3]许安见,邹杨.数据科学与大数据专业培养方案探讨[J].教育教学论坛,2019(5):45-46.

    [4]UC Berkeley. L&S Data Science Major[EB/OL]. https://data.berkeley.edu/degrees/data-science-ba.

    [5]MIT.MIT Course Catalog Bulletin 2018-2019[EB/OL].http://catalog.mit.edu/archive/mit-bulletin-18-19.pdf.

    [6]Stanford University.Undergraduate Programs[EB/OL].https://statistics.stanford.edu/academic-programs/undergraduate-programs.

    [7]University of Waterloo.Data Science Checklist 2017-2018[EB/OL].https://uwaterloo.ca/statistics-and-actuarial-science/sites/ca.statistics-and-actuarial-science/files/uploads/files/datascience-2017-2018.pdf.(編辑:李晓萍)