选课指南-MOC-Data Analytics
-
DA / 课程设置
基础课程6学分:QBUS5001 Foundation in Data Analytics for Business
专业必修核心课程6学分:BUSS6002 Data Science in Business
专业选修课程18学分,选3门课:
QBUS6810 Statistical Learning and Data Mining (DA推荐科目)
QBUS6850 Machine Learning for Business(DA推荐科目)
QBUS6830 Financial Time Series and Forecasting (时间序列+金融相关科目)QBUS6840 Predictive Analytics(时间序列+金融相关科目)
MKTG6018 Customer Analytics and Relationship Management(市场相关科目)
QBUS6310 Business Operations Analysis(偏文科)
INFS6018 Managing with Information and Data(偏文科)
QBUS6860 Visual Data Analytics(数据可视化)
QBUS6820 Business Risk Management
MKTG6999 Customer Social Data Analytical Tools
INFS6023 Data Visualisation For Managers
INFS6024 Managing Data at Scale
ITLS6111 Spatial Analytics
MKTG6010 Machine Learning in Marketing
Capstone QBUS 6600(还没有相关课程信息,悉大官网说2022年会发布该课程相关信息)
近年来,由于国内互联网产业的兴起,悉尼大学DA专业成功挤掉Accounting 成为如今的热门专业。MoC的DA下面设有十几门课程,如何在短短的两年研究生生涯中选择适合自己的课程已是该专业方向下的学生不得不考虑的一个问题。本篇文章将为你解答:
A. DA课程的考查方式
B. 硬核数据软件课程都有哪些
C. 没有任何编程基础能不能学DAQBUS5001 Quantitative Method for Business
开课学期:s1s2
涉及软件:Excel
课程内容介绍
QBUS5001是Master Level统计学的基础,可以说是一门纯粹的数学课,为后续的更高阶的Data Analytics课程打下了基础。从简单的概率计算到复杂的回归模型,descriptive statistics通过地表最强的中心极限定理过度到了inferential statistics。主要是的考核内容集中在概率基本概念,点估计,矩估计,假设检验和回归分析。
考察方式介绍
疫情后的第一学期非常特别。
特别之处其一,是加大了考试的密度。从quiz 1到期中考试,再到后半学期Assessment,感觉一直在考试从未停下脚步。所以催促同学们告别拖延症,每周的内容都不能落下。但是,这样做的好处是减轻了同学们期末考试的压力,并且为同学们建立了极好的数学基础。
特别之处其二,是今年加强了大家对于Excel使用,每次考试和Assignment都格外强调了Excel本身的data analysis和DAP的使用,这是在以往的paper base考试中不存在的。因此要求同学们从学期初就调试好自己的电脑和DAP,以避免在考试前DAP不好用的情况(真有人悲剧过)。
Quiz - 10%
这个部分考核的是全部topic的内容,类似于课前预习,难度适中。
期中考试 - 20%
考核内容是Topic1-5的内容。这次考试中一石激起千层浪。原因一,题量巨大,要求学生在一个半小时内完成60道题。数学问题,本身就要求学生耐心细致的读题,而在时间紧迫的情况下,很多同学失去了认真读题的能力,错过了很多细节性问题或者误解了题目意思。总的来说败在了眼瞎上。原因二,这次考试要求学生开始使用DAP,由于这个插件不是office官方插件,在同学们的Laptop上状况百出。而且在这次考试中,学校要求打开Zoom, 同学们反映“脑子和电脑一起发热”。硬件不给力,运行慢,也是造成很多同学更加紧张答不完题目的原因。
Assignment - 25%
整个Assignment 分成了个人部分和小组部分。从个人部分过度到小组部分,整个作业有一定的连续性。
个人部分:
从数据库当中选择合适的数据下载,然后通过将数据在Excel中可视化来分析数据。 这一部分的难点是把数据类型和相应的可视化方法相互联系。然后根据数据的组成来编好要讲的故事,使数据分析显得更加合理化和更有逻辑性。
小组部分:
在小组成员的个人部分中,挑选最合理的数据用线性回归的方法找到因变量和自变量之间的关系,进而分析出引起因变量变化的因素。这部分的难点是如果选取合适的自变量构建多重线性回归模型的以及对于结果的分析。期末考试 - 45%
到了最终的大Boss期末考试了,期末考试的侧重点在期末以后,特别是对回归分析的考核占了非常多的分数。而这部分回归分析,又是下一阶段课程的开始,所以整个Qbus5001后三章的内容价值连城。同时考试在细节和对知识点的理解上考核非常多,所以要求同学们掌握的细节巨多,话术表述的准确性也有很高的要求。
由于Qbus5001是相对非常客观的一门考试,不存在太多的主观表达。所以,只要同学们吃透知识点,得分情况非常可观。悲剧就是大家掌握知识不够灵活,再加上对于在线考试的不熟悉,再加上那么一丝丝的紧张,导致部分part成绩表现一般。但是这个课是非常容易拿到HD的,如果可以将知识点完全吃透。
职业发展契合度
数据分析无论实在国内还是国外都是相当火爆的一个职业。Qbus5001就是帮你完成数据分析基本知识的一门学科,没有这门课,一切等于零。虽然没有涉及现在非常多使用的Python这样的软件,但是涉猎对于各种软件所执行出来的结果的分析,集实用性实战性于一身。
CFA契合度
这门课就是在CFA中占比10%的Quantitative method。Qbus5001同时涵盖了Level 1的所有内容和大部分的Level 2的内容,性价比极高。BUSS6002 Data Science in Business
开课学期:s1s2
涉及软件:Python
课程内容介绍
BUSS6002的Lecture主要分为四大模块:
第一模块 (Week 1~Week 3) 主要讲解一些纯基础理论,介绍Big Data是什么,Big Data重要性以及数据分析标准流程;
第二模块 (Week 4~Week 7) 开始加入数学和数据相关的知识,主要教授数据分析监督式学习的基础常用模型和概念 (线性回归,逻辑回归,模型选择);
第三模块 (Week 8~Week 10) 探讨“大数据”的计算方法,面对巨量数据我们该如何应对,以及一些深入的模型相关知识。
第四模块 (Week 10~Week 12) 开始补充一些模型完善知识体系,如无监督式学习,自然语言处理还有一些将大数据运用到Marketing的模型。
总的来讲BUSS6002课程涵盖内容十分之广,现阶段数据分析的点基本都有覆盖到,唯一遗憾的是知识深度不够,不过可以之后选QBUS6810、QBUS6850来补充。
另外,这门课的Tutorial教的是Python编程实操,难度由易到难容易上手,每当Lecture讲完一个模型,tutorial就会讲授如何用python进行实现,大家不必担心难度,因为哪怕全部熟练掌握也只是入门水平。
同时,课程还会学习一点SQL,作为悉大为数不多的SQL的课,可以快速上手基础的SQL操作。因此强烈建议大家好好上这门课的tutorial,尤其是没有代码基础的同学,这门课是完善自己短板的最佳机会。
考察方式介绍
Weekly quiz - 10%
每周需要做的一个复习内容的quiz,一共十次,每次一份。基本上好好复习上周的知识要点,这十分拿个7分以上基本没有问题。
Discussion Board Post - 5%
今年新co的布置的一个新的作业,内容是在ED上提出自己的问题并且帮助别人解决问题。今年大家的均分达到了4.4分。
个人作业 - 15%
个人作业与小组作业是属于同一个Case,所以个人作业做得好坏挺影响小组作业的表现,好在个人作业难度不大。均分可以达到11分。
小组作业 - 25%
小组作业会涉及模型,使用 EDA, feature engineering,model building等手段解决老师提出的问题。难度偏大,大家一定要找到靠谱的队友来共同完成。
期末 - 45%
期末考试考察整学期内容,会涉及部分Python的知识点。根据六个学期的期末考题搜集,考试的不算超纲,但是要求对每个知识点深入掌握。
这门课成绩分布较为均衡,拿65-75难度并不是很大,主要因为assignment占比较高 (原因你懂的),但是75分以上的同学不是特别多,也就是好过但难拿很高的分数。
职业发展契合度
从一个前互联网从业者,现咨询从业者的角度来看,这门课的知识是十分有用的,可以在学完后明白非常多的行业用语及知识。QBUS6310 Managing with Information and Data
开课学期:s2
涉及软件:Excel
课程内容介绍
这门课的目的是通过公司的日常操作来分析商业运营情况,并且做出管理决策。商业运营包括了制造业和服务业方面。分析情况的时候尤其是要关注过程,供应链信息和质量问题。
这门课Lecture内容主要包括:EOQ model, newsvendor model, lean operations, TQM, Information Technology, Supply chain strategy, hedging, contracts. (参照2019S2)
前半学期最主要的topic就是EOQ 和Newsvendor的model,这两个模型主要是用来检查库存情况,从而来算profit和re-stock的问题。这个点不仅仅两个Assignment 会涉及,期末也会考,所以一定要弄懂。W5的TQM是个理论题的重点,SPC是计算题的重点(Assignment 3和期末会涉及)。最后两周的contract是必考的,考题类型也简单:要么是buy-back contract要么是IC/IR constraint(理论的题也会被结合~)。考察方式介绍
Group Project - 20%
学期初自行组队,要选择一篇journal article,以组的单位pose这个article在ED上,选择后不可更改。Journal article主要分三类:supply chain management,operational management 和production and operation management。建议初期小组成员做好分工,仔细阅读文章,先选择一些有具体数据和不同年份的article,然后再筛选出1个。(建议小组5个人每人阅读两年的article,这样选择起来快一些)article的选取对assi的分数有决定性的作用,不要等到最后开始写assi 的时候发现article 的选择有问题。
个人作业*3 - 10%*3
2021 S2很有可能会取消了其中一个Assignment,增加了group project的分数)
第一个Assignment 是以simulation的形式考察 (需要用学校邮箱注册),老师会通过你得到的profit 和vote的情况来评分,一般情况下profit占70%,vote 占30%。不熟悉simulation的同学也不需要太紧张,因为Erick会提供practice版本,而且有三次尝试机会。建议小组成员一起做~(ps.虽然这是ass1,但是是夹杂在另外两个ass之间的,在期中之后开始)
Ass2和3需要Excel 来完成(有的问题需要用到solver)。这两个ass考查方式很类似,内容也有重合。EG:给很简单的business case~ 让你来分析一些库存情况。
第二个Assignment主要是考EOQ和Newsvendor model (大概w5要开始准备)。虽然考的主要是计算,文字解释也是需要的。
第三个在newsvendor的基础上会加一些后面的内容,例如U/D test, A/B test之类。这里也需要用到之前QBUS5001学过的confidence level来结合考察。(ass真的会很稳,因为超级nice的老师会在课上教你怎么做ass的题!!所以课可以不去但是recording要听)
Final - 50%
Final 将会涉及所有的topic, 会有8道大题(3道理论题,5道计算题),会提供必要的公式表。题型每年都没什么变化,计算题会类似平时的ass,但是考试没有Excel所以相当于加大了一些计算难度。这门课没有double pass 的要求,而且Erick会在考前给past exam paper。
作业难度: 3颗星(individual ass 简直是在送分,但是group ass想HD还是要下点功夫)
考试难度: 4颗星(题型都是固定,但Erick可能会在题目里设定小陷阱,不过认真审题也是没问题的)QBUS6810 Statistical Learning and Data Mining
开课学期:s1s2
涉及软件:Python
课程内容介绍
QBUS6810是BUSS6002监督式学习部分的延伸,在原本线性回归和逻辑回归的基础上新加了很多更加复杂好用的模型,比如GDA,决策树,随机森林,Boosting和模型融合等,但也意味着与BUSS6002在很多方面有重合。
随着模型的增多,考试的知识量也相应增加,这门课主要的难度就在各类模型之间的区分和联系,不过学完可以使你对整个回归和分类体系有很好的认知。虽然也有考察推导,但是推导题老师在tutorial里给出了范围,基本不会超出。
考察方式介绍
期中 — 20%
小组作业 — 30%
期末 — 50%
期中考试考察1-5周的内容,小组作业是Python代码+report的形式,QBUS6810一直都是Airbnb的项目实战,根据房源特征预测租金,期末考试考察整学期内容,总得来说pass容易,高分略困难,根据2020年S1以及S2的情况,期末中有部分题目考的很细属于拉分题。
职业发展契合度
如果大家不是做算法工程师,细致的学完QBUS6810基本能够满足大多数非技术岗 (商业分析师,产品经理) 对于数学模型方面的要求,在数据分析师的要求上也能打一个比较好的基础。并且assignment设计非常合理,可以作为课内实战项目在面试中介绍。这门课作为QBUS6850的先修课,是BA中数据分析分支加点方案中的重要一环。QBUS6820 Management Decision Making
开课学期:s1s2
涉及软件:Excel
课程内容介绍
这门课是通过一些business case让同学们更好的理解和控制商业风险,题型固定,所以阅读理解能力很重要。整学期围绕着prospect theory, stochastic optimization, robust optimization, real options,credit risk这几个大topic来的~期末基本都是这5个topic各一题,考试模式很固定。
前两周都在讲一些铺垫的知识(为了引入risk这个概念)。接下来w3和w4就会开始一个比较重要的小点也就是VaR (期中考会涉及)。w7讲prospect theory(在第五周有一个悄咪咪的伏笔),而第9,10周就开始重头戏optimization了。w11和12主要real option 和credit risk, 这两周相对很简单也容易理解,这两周会涉及理论了,不过都是很基础很简单的(简直送分)。Lecture每周两小时,tutorial1小时,都不算出勤~
整体来说其实这门课是相对容易的,老师没有搞套路,虽然期中考平均分并不高,但是想pass一点也不难,努力的同学也很有希望拿HD! 考查主要以计算为主。侧重点还是后半学期的知识,毕竟final占比最高。
考察方式介绍
Assignment 两个 - 30%
Ass一般是5个人一组,一般要先自己组好队,不然会被老师随机分组。ass主要考察应用能力(结合excel),开放性不大,平均分超级高。
第一个assignment 有两道题。第一题一般写一篇关于操作风险的真实案例的论文,分析导致这种风险的因素。第二个问题需要Excel来分析股票收益及其与整体市场收益的关系。
第二个assignment是通过Excel测试不同的stochastic optimization方法(与w9有关)。
期中考 - 25%
因为疫情的关系,去年的期中考试取消,由六次限时Weekly Quiz代替,考试题型是五道选择题或填空题,主要是阶段性对当周内容的考查,涉及理论和计算,时间比较紧。2021年Semester 2的考核形式如何,我们拭目以待。
期末 - 45%
期末主要是考察后半学期内容,老师并不会出一些超纲题(考前还会给past exam paper+答案讲解, 每年题型基本一样)。而且没有double pass~
考试都可以带两页cheat sheet来抄公式(A4 double side+尽情缩放), 考完会收上去~ 不过尽管可以带notes,也要熟悉公式和算法。因为毕竟考试时间紧张,如果只靠临场发挥会来不及。
推荐指数: 4颗星 (挂科率真的低,算一门水课)
作业难度: 4颗星(老师会在lecture讲解assignment的做法~)
考试难度: 3.5颗星(毫无套路,真的是学什么考什么)
教学团队: 5颗星(教学安排真的给力!)
实用性: 4颗星(虽然不能增加编程技能,但是这门课也算实用了)QBUS6830 Financial Time Series and Forecasting
开课学期:s1s2
涉及软件:Matlab
课程内容介绍
这门课主要涉及的是time series (时间序列) 相关的内容,这门课每周有2小时的Lecture 和1小时的tutorial。在BA专业方向下面,有且仅有两门涉及时间序列,分别是QBUS6830和QBUS6840。由于QBUS6830 是原先Quantitative Finance (现本专业方向已取消) 的必修课,这门课不管从内容上,作业上还是考试上都比QBUS6840难一些 (尤其是作业上),但是pass还是不难的。
这门课的内容基本上分为三大模块:
第一模块(Week 1~Week 4) 介绍时间序列,CAPM,factor model (因素分析),线性回归等一些基础知识,以及判断forecast准确性的方法。后两模块开始对时间序列数据 (其实就是return数据) 进行建模+预测。
第二模块 (Week 5~Week 6) 是对return进行分析,会用到AR, MA和ARMA 这几个model。
第三模块 (Week 7~Week 13) 是对volatility进行分析,有ARCH,GARCH等多种模型,其中最重要的就是ARCH模型,后面基本上都是它的变形,掌握了ARCH模型后面的也就不难理解了。
这门课的Tutorial就是给数据,然后tutor带你写Matlab的code,刚开始掌握起来可能有点困难,但是上完两三节tutorial之后也就知道大概了,而且基本上每节课都会有上一节课的内容,也就巩固了一遍。Tutor会给lab code的solution,所以不用担心。只要知道每个code是干什么用的,作业基本上是不用担心的,可以复制粘贴。另外还有一点是要会看结果,运行code出来的结果需要会分析 (哪个模型比较好,哪里可以改进等),这个solution里面也会有,写小组作业和考试之前看一遍就可以。
考察方式介绍
小组作业 - 40%
因为疫情原因,2020S1变成了自己组队 (之前都是随机分组),4-5人一组。在这门课中找到好队友是非常关键的,作业量会有点大,涉及整学期的所有模型,而且要写code和report。Deadline在第12周左右,时间是很充分的。作业会有三组数据和问题,比如有的组让你用AR-GARCH,有的用EGARCH之类的,用的对比组数据可能也有不同,但是整体思路是一样的。很多code是可以从lab solution里面复制粘贴的,但是可能需要结合一下,因为不可能完全一样。重点是在后面分析volatility的模型上面,作业里面这部分占比比较多,所以需要把期中考试之后的内容掌握好,不然直接写会很困难。
作业提交分为Matlab code部分,Excel数据部分 (Matlab的结果) 和Report部分,Excel的结果可以和那些和你用同一组数据的人对一下答案,report部分也不难,基本和solution里面的分析差不多。小组作业给分还是很不错的,高分很多,70%以上基本不是问题。
期中 - 20% & 期末 - 40%
这门课在以前考试难度是比较大的,拿高分比较困难,但是线上考试 (有监考,不是quiz类型)都是选择题,难度也就降低了很多,拿高分的学生变多了。不过老师出的题目里有很多小陷阱,需要格外小心。
期中考试大概是八道简答大题,工作量较大,考核内容比较广,涉及week1-6的内容。要求对知识点掌握熟悉,对理论和公式的理解需要做到“用自己的话能准确表达” 的程度。需要会推导,掌握lecture上的内容,可能会有一些带入数据的计算。期中考试理论偏多,而且有的问题会考的比较细 (比如AR(2)的“2”什么意思),所以需要仔细复习。
2021S1的时候老师在最后一周划了重点,告诉你那个要考哪个不会考,还会给practice question,很有帮助。其实主要还是后面几个模型,要搞懂为什么要用这些模型,怎么评估,怎么推导。这里重点就是AR-GARCH(1,1) 模型,需要重点掌握!必须会推导,掌握了这个其他也就不难了。
推荐指数:4星 (如果想对模型假设有进一步理解的BA同学可以选择,对于学习QBUS课程的提升还是挺大的)
作业难度:4星
考试难度:4星
老师友好:5星 (虽然难,老师不会挂人,作业给分也挺高)
软件技能锻炼 (Matlab):5星
pass难度:低
hd难度:中高QBUS6840 Predictive Analytics
开课学期:s1s2
涉及软件:Python 和 Matlab
课程内容介绍
这门课程相比其他QBUS课程最大的区别在于它的研究对象是时间序列 (同一对象在不同时间点下的数据),而不是横截面数据 (同一时间点下不同对象的数据)。QBUS系列另一个涉及时间序列的课程是6830,两者相比而言6830偏向时间序列在金融领域的应用,因此会结合很多金融模型,所用编程软件为MATLAB,而6840更偏向从纯统计学角度进行分析,所用软件为Python。
整个课程基本可以分成三大模块:
第一模块(Week 1~Week 4)会介绍一些有关时间序列的基本概念,以及简单基础的时间序列模型,这些模型理解起来较为容易,算法也比较简单,接近常识认知,考察上以概念和计算推导为主,比例接近五五开;
第二模块(Week 5~Week 9)是课程的绝对核心,会在第一阶段的基础上继续加深,介绍以holt系列和ARMA系列为核心的几种目前比较主流的时间序列分析模型,内容上涉及少量概念和大量推导,在考试中占比很大;
第三模块(Week 10~Week 13)会介绍一些比较前沿的分析方法,这一部分的内容每学期可能会有一点小变化,一般涉及神经网络、状态空间等模型,考察形式是少量概念和计算,套路性比较强,掌握套路比较容易拿分。总体来说,如果能够充分理解课程内容,并且多做练习,这门课是相对容易拿高分的,因为大部分内容(包括考试和作业)都是以客观题的形式考察的;如果不能完全理解但能够掌握解题套路,也能够拿到一个比较好看的分数,因为核心内容占据了大部分的分数,很少出现考察零碎偏门知识点的情况。
这门课的lecture和tutorial的分工也比较明确,lecture对接考试,主要是理论部分的学习;tutorial对接作业,主要是带着大家写代码跑代码理解代码,作业里用到的比较多。
考察方式介绍
个人作业 - 20%
近几学期个人作业有一定波动,难的时候会有不少同学遇到有几题看不懂或者完全没有思路的,但最近两学期的趋势是变简单的,主要涉及前半学期内容在Python里的实现,拿高分机会较大。
期中考试 (2020s1s2取消)
2020年由于改为网课取消了期中,正常情况下是考察前6或前7周的内容,涉及的知识点相比期末少,但深度上可能超过期末,主要难在题型创新,所以要求大家真正理解所学知识点而不是依靠刷题或者记套路,拿高分机会较大。
小组作业 - 30%
作业的形式是个Project,要求大家将理论和code结合做一份完整报告,会涉及整学期大部分知识点,主观性和开放性相较个人作业强,需要用到多个模型完成。
期末考试 - 50%
期末主要考察后半学期的内容,涉及大量推导 (70%) 和一定的概念 (30%),推导是期末考的重中之重,也是难点所在,所以需要大家对推导过程有充分理解和熟练度,保证正确率和做题速度,拿高分机会较大。
总结而言,个人作业、期中考试、期末考试理论和客观题占比大,都是拿高分的好机会,有冲高分想法的同学可以多下下功夫。
推荐指数:4星(从时间序列的角度了解数据是实际应用中非常重要的一个维度,并且涉及时间序列的课程较少;挂科率较低,拿高分机会大)
作业难度:3.5-4星(视各学期情况有所波动)
考试难度:3.5星
教学团队:4.5星(认真负责,课程安排合理,给分合理)
实用性:4.5星QBUS6850 Machine Learing for Business
开课学期:s1s2
涉及软件:Python
课程内容介绍
对于机器学习有兴趣的同学和希望python成为你工作技能的同学,这是你绕不开的选择。这门课本身不难通过。
从2019年的角度上讲:Wang Chao是co的2019的6850相对于6810的提升在于模型细节和基础线代知识,比如KNN,RF,Boosting等,推导难度不高。对比6810的新内容主要有支持向量机(svm),推荐系统(协同过滤算法为主),矩阵分解(SVD和NMF),神经网络(没有cnn也没有rnn,只有普通的多层感知机,以推导为主,没有keras的使用也没有tensorflow,pytorch等)。2019年的特点,难度不高但是作业多压力大,还好给分良心。模型和概念相对老旧,小组作业和6810没区别。
从2020年的角度上讲:对比2019年,换co后,Stephen 更注重商科学生的计算机基础,从最开始的哈希概念,贝叶斯优化,汤普逊采样等没有出现在之前6850的内容就可以看出,Stephen是对基础概念比较重视的co,这些内容对商科学生来说完全理解是有点难度的,但是对于想半路出家进技术岗的同学是有帮助的。另外一个重要的不同点在推荐系统的内容里,不同于Wang Chao对于主要描述的是协同过滤法和相似度计算方法,Stephen介绍的是推荐系统算法的思想,多臂老虎机的描述其实引出了强化学习的概念(最近还挺火的),这部分内容不如之前好理解但是确实是一个对于推荐系统更全面也更与时俱进的描述,考试考的比较简单,但是如何理解和代码实现是需要花功夫的。2020年的小组作业是用基础的sklearn中的方程(Decision Tree等)自己写出adaboosting算法。个人认为这个比kaggle比赛更能锻炼同学们的代码能力,也能帮助到对算法的理解。
在一定程度上来说2019和2020的内容是有互补性的,但是wang chao毕竟是中国人,讲课方式比Stephen来的更加让人听的懂一些。
考察方式介绍
期中期末 - 75%:
5道大题左右。文字性大题着重考察各个知识板块,模型的理解(优劣)和区别;计算(线上)一般只要求给出最终答案,类型都是各章节重点模型,掌握课上的例子解决起来问题不大;一般会有一道数学推导题,结合矩阵运算进行考察。
小组作业 - 25%
三道题,都需运用Python,最终以Report形式呈现。以2020S2为例:第一题第三题需运用代码人工演算课程重点章节的运算过程并进行分析,这学期考察了EDA, Gradient Descent,以及神经网络。第二题还是Kaggle,给到大家数据库,选择模型进行价格预测,但这部分相比较QBUS6810会考察的更深入,会要求学生分析如何分析并提升相应模型。
推荐指数:5星
作业难度:3-4星(编程课不同同学不同感觉,但是不算难的)
考试难度:3.5星
教学团队:4.5星(认真负责,给分合理)
实用性:4-5星(算是有些私心,但是在MOC底下没有更好的锻炼一门编程语言的机会了)QBUS6860 Visual Data Analytics
开课学期:s1s2
涉及软件:Tableau & Stata & Excel
课程内容介绍
这门课主要侧重于培养学生数据处理、数据可视化、数据分析的能力。在数据处理方面,主要运用Excel/Stata/其他数据处理软件进行数据特征的探寻、数据格式的调整、特殊数据的转化与处理,从而挖掘出数据模式、变量间关系等有价值的信息,为下一步可视化做好数据基础。在数据可视化方面,这门课程主要使用的是Tableau软件,涉及到变量的创建、正则表达式及各类图形、仪表板的制作。Tableau是一款高效、美观、较易上手的数据可视化分析软件,也是许多商业分析岗位的必备软件之一。在数据处理、数据可视化的过程中,学生需要对过程中得到的信息进行辩证分析,对做出的图形进行深度探究,并就此给出相关发现和建议。
在商学院的所有课程中,INFS6023 (Data Visualization) 也是培养学生运用Tableau对数据进行可视化处理,但相比较而言,QBUS6860使用的数据处理工具种类更多,同时更侧重于培养学生的分析能力。
整个课程基本可以分成两个部分,
第一部分(Week 1~Week 6)主要讲述了图形的理论,以及人类如何理解图形形式的信息。具体来说,前六周主要讲述了生活中图形所涵盖信息的理解。同时,前六周也讲述了如何通过形状、颜色等方法来让一个可视化图像包含多种维度的信息。
第二部分(Week 7~Week 12)主要讲述了如何通过统计工具来对数据集进行处理,从而更好的进行可视化分析,同时也讲述了如何更好的处理数据集的缺失和可能存在的极端值等一些数据处理方式
这门课的lecture和tutorial的分工也比较明确,lecture主要是理论部分的学习;tutorial对接作业,主要讲述如何运用tableau进行数据可视化分析,作业里用到的比较多。
考察方式介绍
这门课的考察方式主要是作业形式,每学期基本都是60%的小组作业、30%的个人作业和10%的quiz。具体作业安排看各学期情况而定,近两个学期来看,这门课的作业数量呈下降趋势,减少了学生的工作量。
个人作业 - 30%
一共有6个assignment,平均分下来不到两周就会有一个,平均每个assignment需要花费5个小时以上的时间完成。assignment的内容与上课老师所讲的知识点相关。前2个assignment分别占总成绩的2%,后面4个assignment分别占总成绩的6.5%。每周assignment的截止时间在周二的11:59 pm,因此合理的时间规划非常重要。
小组作业 - 60%
这门课程包含4次小组作业,每个小组作业占总成绩的15%,小组作业会涉及整学期大部分知识点,主观性和开放性很强。
总结而言,这门课程的课业量很大,需要合理的分配时间。平时给分不会太低,但拿高分的难度也相对较大。
Quiz - 10%
相当于考察出勤,大多数同学都是满分
推荐指数:4.5星(数据的可视化分析能力在实际工作中非常重要,并且涉及数据可视化分析的课程较少;挂科率低,但拿高分难度大)
作业难度:4.5星(视各学期情况有所波动)
教学团队:4星(认真负责,课程安排合理,给分严格)
实用性:5星MKTG6018 Customer Analytics and Relationship Management
开课学期:s2
涉及软件:Tableau & SPSS & Python
课程内容介绍
课程内容主要分为理论知识和上机操作。其程核心是通过数据分析得到客户洞察,并且呈现,涉及从数据收集,清洗,分析,再到数据可视化。如果对statistics学科有一定基础,本课程将相对简单。没有statistics背景的学起来有一定难度,但是可以攻克。课程的难度在于结合marketing的理论知识与数据分析实操。
考核内容包括:
40% Final Exam;
10% Data Case Write-up;
30% CRM program report;
10% Final Presentation;
10% Participation.
其中50%的比重是以小组为单位的作业,所以在学期开始找到靠谱的队友对这门相当重要。
Final exam考核marketing理论知识和软件上机操作。
课程配置内容充实,对于现在数据导向的marketing来说是一门相当收实用的课。如能熟练运用课程中所教的软件,对充实简历很有帮助。职业发展方向customer analytics,market researcher等。
推荐指数:4星
作业难度:4星(视各学期情况有所波动)
教学团队: 4星
实用性:5星INFS6018 Managing with Information and Data
开课学期:s1
涉及软件:Tableau/Tableau Prep
课程内容介绍
这门课原来叫Managing Business Intelligence,改名后会更有侧重。课程涵盖内容比较广,涉及整个Business Intelligence体系,但都不会特别深入。课程主要关注数据收集分析对商业决策的价值,尤其是对数据信息系统架构的理解。但不需要担心,除了最后的小组作业需要Tableau软件运用之外,其他全是理论内容。老师喜欢课上进行case study讨论,但几乎和考试作业都没什么关系。认真学习PPT,理顺逻辑的话,考试和作业难度都不大。适合配合其他数据类课程一起上,缓和一下压力。
考察方式介绍
Quiz — 35%
Quiz是2020年第一次出现的考核形式,大家题目都一样,内容几乎都在PPT上,是拿分关键。过去的一个学期情况是一共七个quiz,每个quiz占比5分。
期中考试 — 35%
这是比较稳定的考核形式。闭卷考,由选择题和简答题组成。选择题基本就是PPT上的理论内容。简答题会包括一篇提前给出来的case, 可以提前准备。考试前一周一般也会有一个考前准备lecture,老师会详细给出sample题,虽然不会考,但是对简答题思路还是有帮助的。
小组作业 — 30%
这也是比较稳定的考核形式。一直是六个人一个小组。题目也几乎没变。会主要涉及期中后讲解的内容,包括数据库架构和Data Visualisation (Tableau 软件应用)。作业要求很详尽,总体难度不大。主要看小组成员对理论内容的理解和团队合作。
推荐指数:4星
作业难度:3.5 星 (小组作业难度不高,但如果不熟悉Tableau和课程内容的同学,理解起来还是需要花费一定精力和时间。)
考试难度:4 星 (期中考试基本就考前四周内容,需要理解各部分内容如何关联起来,不然背下来答题还是有难度。)
教学团队:3.5 星 (老师只要稳定考核形式的话,整体上给分也还不错。)
实用性:4 星 (是比较贴合Business Analyst工作内容的课程,老师也是工作党,虽然更多是在管理层面的理解上。)INFS6023 Data Visualisation for Managers
开课学期:s1
涉及软件:Tableau/Tableau Prep
课程内容介绍
这门课2020年及以前叫Data Visualisation, 从2021年开始多加了for Managers。课程主要讲解从决策角度出发,数据可视化的相关理论和Tableau相关技能。但从for managers的角度看,就知道课程对硬技术要求不高,完全不需要编程。再加上没有考试,是一门相对比较“水”的课。不过难点更多的是需要从一个比较宏观全面的决策层面去理解project,设计visualisation呈现。如果没接触过Tableau的同学,需要尽早跟着课程进度做Tableau练习,后续作业会相对轻松一些。如果喜欢设计和visualisation的同学会发现整个课程内容还是挺有趣的。
考察方式介绍
四个Quiz — 20%
每次十分钟十道题,只在每个stream随机特定开放的十分钟内可以做。贯穿整个学期,题库有越来越大的趋势。
个人作业 — 30%
一般来讲会给一个很大的数据库,然后自己从里面挑适合的数据,完成一个需要用到Tableau的visualisation和一个report。是理论和操作相结合的作业。
小组作业 — 50%
一般是六个人一组,具体看本学期老师安排,必须同一stream。分为一个35%的report加tableau project 和15%的presentation。report部分和个人作业需求比较相近,只是更为复杂。数据的话,给到大家的都是一样的。presentation基本就是展示report相关内容,有Q&A,但压力不大。
推荐指数:4星
作业难度:4星 (开放性很大,课上讲得内容也比较理论,做好作业几乎全靠自学成才。)
教学团队:3.5 星 (团队比较喜欢每学期换作业题目,加大quiz题库,所以题目质量有的不经推敲。另外因为作业的开放性,虽不容易挂科,但普遍给分不高。)
实用性:3.5 星 (Tableau还是一个很实用的软件。通过这门课入门,再通过课外努力考个相关证书,也还挺实用的。)
DA课程的介绍和推荐就正式结束了,希望能帮助到各位迷茫纠结的小伙伴们。