TRU科学

知识准备

要想在数据科学课程中取得成功,你需要具备三个支柱知识,即数学、统计学和计算科学,以及领域知识。数据科学是一门新的学科,对于即将入学的学生来说,在这里提到的三个领域都有全面的背景是极其罕见的。我们将选择我们认为最有可能在短时间内填补预期知识空白的学生(例如,夏季的自学,一些视频等在线资源,短期课程或从过去的课程中扩展知识点),并在之后的项目中取得成功。

请注意,中提到的四门课程入学要求是这个项目的最低录取要求。为了在数据科学课程中取得成功,并为以后的研究项目做好准备,鼓励学生在三个方面加强准备。为此,我们提供了下面的主题列表,以指导学生检查他们对知识要求的准备情况。

1.数学支柱:

线性代数:

  • 向量空间证明
  • 矩阵反演定理
  • 对角化/分解
  • 正交化和投影
  • 矩阵方程

计算:

  • 单、多元积分和微分学

2.统计支柱(一般为2-3个高级统计课程):

  • 描述统计学概论
  • 基本概率:期望,总变量,双重期望,矩生成函数
  • 集中趋势介绍
  • 回归概论
  • 抽样和实验设计的介绍
  • 最小二乘的矩阵和微分解(简单线性回归和多元线性回归)
  • 模型诊断,模型选择
  • 常见分布的推导(如泊松分布、t-分布、卡方分布、γ分布)
  • 各种检验统计量和置信区间构造的理论与应用
  • 极大似然主题
  • 贝叶斯方法,包括导数
  • 似然比检验
  • 似然比检验证明
  • 中心极限定理的证明
  • 注意:点击在这里下载一个PDF文件,其中包含回归和推断主题中更详细的在线资源列表。

3.计算科学(数据库和算法):

  • 计算机科学中表示数据的基本方法
  • 实现和分析基本数据结构,例如列表、堆栈、队列和图
  • 使用数据结构实现算法
  • 每种数据类型的成本权衡
  • 数据库的概念
  • 数据库设计技术,采用实体关系模型和面向对象的方法设计数据库系统
  • 数据描述语言、数据操作语言(更新、查询、报告)和数据完整性