数据科学硕士
-
学院:数据科学学院
数据科学学院
香港城市大学数据科学学院为香港城市大学近年来新设立的学院,提供全面的本科和研究生课程,以培养未来的全球范围内急需的数据科学家人才。学院努力为具有专业领域知识的学生提供坚实的数据科学基础,例如商业分析、金融技术、社交媒体分析、健康信息学、工程系统和智慧城市技术。学院与相关行业领域的广泛合作伙伴关系和活动将为学生提供解决实际问题的技能,为保护隐私并实现网络安全开发有效的分析。学院也将迎接一切机遇和挑战去建立一个具有持久的区域内以及全球的社会影响力的世界级数据科学学院。
课程内容
该课程旨在培养数据分析毕业生,以满足对高级数据科学技能不断增长的需求,并为毕业生做好准备,将数据科学技术应用于组织决策中的知识发现和传播。它还旨在帮助数据分析专业人士提升其技术管理和开发技能,并为相关定量领域的学生快速过渡到数据科学职业提供坚实的途径。在完成本课程后,学生应能够应用适合数据科学学科的科学和工程知识、了解当代技术的理论基础并将其应用于跨学科管理、挖掘和分析数据、理解计算工具并使用数据驱动的思维来发现新知识并解决具有复杂结构的现实世界问题、认识到需要并参与不断学习新兴和创新的数据科学技术和思想、以书面、口头和视觉形式交流想法和发现,并在多元化的团队环境中工作。
核心课程介绍
统计机器学习 I
本课程侧重于统计机器学习的理论基础和基本方法,涵盖机器学习概率论和统计推理的关键概念和结果,回归和分类的经典和前沿方法和理论,核的理论基础方法。
探索性数据分析和可视化
本课程的目标是向学生介绍总结数据和相关视觉方法的基本探索技术。探索性数据分析通常在正式建模开始之前应用。它可以帮助制定假设并为更复杂的统计模型的开发提供信息。本课程首先介绍探索性数据分析中使用的基本图形技术,然后介绍典型的探索性分析统计方法,包括聚类和降维技术,使您能够对高维数据进行图形显示,然后重点介绍用于分析的可视化技术和方法。广泛的数据类型。将引入感知原理来设计有效的数据可视化。
存储和检索数据
本课程提供关系数据库的知识和对 Hadoop/Spark 系统的介绍,包括用于设计关系数据库的实体关系模型、数据库开发过程的原理、用于通过数据库检索和存储数据的结构查询语言以及介绍级 Hadoop/Spark 内容。
统计机器学习 II
本课程侧重于无监督和监督学习的理论基础和基本方法,包括支持向量机、正则化方法、主成分分析、聚类、核方法和深度学习方法以及应用 Python 编程和实现上述学科算法和方法。
数据科学研究项目
本课程为学生提供了充分的机会来展示他们独立处理数据分析问题的创新能力和主动性,培养将数据科学知识和数据分析技能整合和应用到实际场景的能力,并探索有关道德和隐私的考虑数据收集和管理的含义。
这门课程也为学生提供了一个平台,让他们通过数据科学知识来展示和分享对实际问题的新颖研究。
师资力量
课程项目主管,Dr. TAN Matthias Hwai-yong (陳怀勇博士),副教授
教育背景:
马来西亚理工大学本科工学学位
新加坡国立大学硕士工学学位
美国乔治亚理工大学博士学位
研究兴趣:
统计学习
不确定性量化
物理与计算机实验的设计与分析
工程及工业统计
贝叶斯统计
论文发表(节选部分):
Tan, M.H.Y. and Ng, S.H.* (2009). “Estimation of the Meanand Variance Response Surfaces when the Means and Variances of the NoiseVariables are Unknown,” IIE Transactions, 41(11), 942-956.
Tan, M.H.Y. and Wu, C.F.J.* (2012). “Generalized SelectiveAssembly,” IIE Transactions, 44(1), 27-42. (Feature Article: IE Magazine 2011,43(10), page 50)
Tan, M.H.Y. and Wu, C.F.J.* (2012). “Robust Design Optimizationwith Quadratic Loss Derived From Gaussian Process Models,” Technometrics,54(1), 51-63.课程项目副主管:Dr. FENG Long (馮龍博士),助理教授
教育背景:
中国人民大学统计学与数学学士学位
美国罗格斯大学统计学博士学位
耶鲁大学博士后
主要研究方向为统计机器学习,重点研究图像数据分析和变量选择。
论文发表(节选部分):
Feng, Long. & Zhang, Cun-Hui. (2019). Sorted Concave Penalized Regression. Annals of Statistics. 47/6. 3069 -3098. doi:10.1214/18-AOS1759
Feng, Long. & Dicker, Lee. H. (2018). Approximate nonparametric maximum likelihood for mixture models: Aconvex optimization approach to fitting arbitrary multivariate mixingdistributions. Computational Statistics &Data Analysis. 122. 80 -91. doi:10.1016/j.csda.2018.01.006Get
Feng, Long. , Ma, Ruijun. &Dicker, Lee. H. (2017). Nonparametric MaximumLikelihood Approximate Message Passing. 51st AnnualConference on Information Sciences and Systems (CISS). (pp. 1 - 6). doi:10.1109/CISS.2017.7926084
课程计划和毕业要求
全日制课程时长为一年,学生应满足了相应的课程要求才能顺利获得硕士学位,即顺利修完30个学分(由必修课15学分和选修课15学分组成)。
申请建议
学校倾向于招收拥有工程、科学或其他相关学科背景的学生,申请时即要求提交合格的语言成绩,托福最低要求79分或雅思最低要求6.5分。对于那些申请时未出分,无法提交雅思或托福成绩的学生,可以使用合格的大学英语六级考试成绩来替代。由于香港城市大学的申请采取rolling的方式,并一直持续到所有名额招满为止,因为建议学生要尽快准备好相关的申请材料,尽早提交申请更能占得申请先机。