TRU科学
知识准备
要想在数据科学课程中取得成功,你需要具备三个支柱知识,即数学、统计学和计算科学,以及领域知识。数据科学是一门新的学科,对于即将入学的学生来说,在这里提到的三个领域都有全面的背景是极其罕见的。我们将选择我们认为最有可能在短时间内填补预期知识空白的学生(例如,夏季的自学,一些视频等在线资源,短期课程或从过去的课程中扩展知识点),并在之后的项目中取得成功。
请注意,中提到的四门课程入学要求是这个项目的最低录取要求。为了在数据科学课程中取得成功,并为以后的研究项目做好准备,鼓励学生在三个方面加强准备。为此,我们提供了下面的主题列表,以指导学生检查他们对知识要求的准备情况。
1.数学支柱:
线性代数:
- 向量空间证明
- 矩阵反演定理
- 对角化/分解
- 正交化和投影
- 矩阵方程
计算:
- 单、多元积分和微分学
2.统计支柱(一般为2-3个高级统计课程):
- 描述统计学概论
- 基本概率:期望,总变量,双重期望,矩生成函数
- 集中趋势介绍
- 回归概论
- 抽样和实验设计的介绍
- 最小二乘的矩阵和微分解(简单线性回归和多元线性回归)
- 模型诊断,模型选择
- 常见分布的推导(如泊松分布、t-分布、卡方分布、γ分布)
- 各种检验统计量和置信区间构造的理论与应用
- 极大似然主题
- 贝叶斯方法,包括导数
- 似然比检验
- 似然比检验证明
- 中心极限定理的证明
- 注意:点击在这里下载一个PDF文件,其中包含回归和推断主题中更详细的在线资源列表。
3.计算科学(数据库和算法):
- 计算机科学中表示数据的基本方法
- 实现和分析基本数据结构,例如列表、堆栈、队列和图
- 使用数据结构实现算法
- 每种数据类型的成本权衡
- 数据库的概念
- 数据库设计技术,采用实体关系模型和面向对象的方法设计数据库系统
- 数据描述语言、数据操作语言(更新、查询、报告)和数据完整性