一、目标任务

为了加深对课程内容的理解,检验对所学方法的掌握程度, 促进对数据科学现代发展的兴趣,本课程以论文的形式,在规定时间内对要求同学们完成论文复现,从而落实对数据科学领域各类方法的掌握。

二、设计内容

本课程的设计内容主要包括对经典的机器学习工作进行深入学习和复现。首先,学生需要阅读教材中每章后的扩展阅读和参考文献,深入理解相关理论和方法。在阅读过程中,要求学生撰写详细的读书笔记,记录关键概念、算法原理以及重要的数学推导,形成系统的知识框架。其次,学生需要对所学的经典算法进行代码复现,通过实际编程实现算法,深入理解其具体实现细节和在不同数据集上的表现。对于涉及的数学证明部分,要求学生尝试完整地推导复现,深入理解算法背后的数学原理和逻辑推演过程。通过这一系列的学习与实践,学生将能够掌握机器学习的核心算法和理论,培养独立思考和解决问题的能力。

三、时间安排

2025.02.23 日之前提交

四、设计工作要求

在进行设计工作时,应严格遵循以下要求,以确保成果的规范性和完整性:

  1. 格式正确
    • 采用统一的格式,包括字体、字号、行距和标题层级。
    • 确保图表、公式、代码等排版规范,易于阅读和理解。
    • 目录、页码、引用等要完整准确,符合规范。
  2. 内容完整
    • 设计文档需涵盖设计背景、需求分析、设计目标、方法选择、实现过程和结果分析等内容。
    • 涉及的数据、参数、算法及实验条件应记录完整,便于复现和验证。
  3. 方法选择恰当
    • 根据设计目标和约束条件,选择合适的方法或模型。
    • 充分比较不同方法的优劣,明确选择依据,确保方法的科学性和合理性。
  4. 表达清晰
    • 语言简明准确,避免歧义和冗余。
    • 公式推导、图表说明和实验结果描述清楚,逻辑严谨。
    • 结构层次分明,段落清晰,便于理解和查阅。
  5. 结果详实
    • 提供充分的实验或测试数据,详细展示结果。
    • 通过表格、图形和对比分析,直观展示设计效果。
    • 对结果进行全面的分析和讨论,指出可能存在的问题和改进方向。

五、成绩评定

视方法难度和结果的丰富性给定分数。

六、参考文献

Mehryar Mohri; Afshin Rostamizadeh; Ameet Talwalkar. Foundations of machine learning. MIT press, 2018.