Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

math-for-ai #326

Open
3 tasks done
hrjtju opened this issue Feb 20, 2025 · 0 comments
Open
3 tasks done

math-for-ai #326

hrjtju opened this issue Feb 20, 2025 · 0 comments
Labels

Comments

@hrjtju
Copy link

hrjtju commented Feb 20, 2025

你是否已经阅读并同意《Datawhale开源项目指南》?

你是否已经阅读并同意《Datawhale开源项目行为准则》?

项目简介

“math-for-ai”是一个致力于为机器学习和人工智能学习者提供全面数学基础支持的项目。该项目旨在通过整理和整合各种数学资源,帮助学习者更好地理解和掌握机器学习背后的数学原理。项目内容可能包括但不限于数学教程、书籍翻译、在线课程推荐以及相关数学工具的介绍。

立项理由

立项的主要理由是解决大多数大学工科学生在学习机器学习时面临的“Knowledge Gap”问题。尽管机器学习和人工智能领域发展迅速,但许多学习者在数学基础方面存在薄弱环节,这限制了他们对高级概念的理解和应用能力。因此,该项目希望通过系统化的数学资源整理和优化,填补这一知识空白,帮助学习者更顺利地进入机器学习领域。

项目受众

项目的受众主要包括:

  • 大学工科学生:尤其是计算机科学、电子工程、自动化等专业的学生,他们在学习机器学习和人工智能课程时,往往需要更扎实的数学基础。
  • 机器学习和人工智能的初学者:包括自学者和在职人员,他们希望通过系统学习数学知识来提升自己在该领域的竞争力。
  • 对数学基础有进一步提升需求的从业者:那些希望在机器学习和人工智能领域深入研究或从事高级开发的人员。

项目亮点

  • 全面性:项目不仅提供经典的数学教材(如Marc Peter Deisenroth等编写的《机器学习的数学基础》),还广泛收集和整合其他相关资源,形成一个泛用性强的数学教程。
  • 实用性:通过翻译和整理,使学习者能够更容易地获取高质量的数学学习材料,减少因语言或资源限制而产生的学习障碍。
  • 针对性强:专注于机器学习和人工智能所需的数学知识,避免了传统数学教材中过于宽泛的内容,使学习者能够更高效地学习和应用。

项目规划

内容、时间:已完成初步翻译的一半,剩余部分预计在六月完成
人员:目前贡献人员为马世拓、何瑞杰(按照贡献比例排名);目前正在招募更多社区贡献者

项目大纲(初步,仅限MML书籍的翻译,不排除完成翻译之后添加更改大纲序号)

第一部分:数学基础

1. 引言与动机

  • 直观概念的数学表达
  • 阅读本书的两种方式
  • 练习与反馈

2. 线性代数

  • 线性方程组
  • 矩阵
  • 解线性方程组
  • 向量空间
  • 线性独立
  • 基与秩
  • 线性映射
  • 仿射空间
  • 进一步阅读

3. 解析几何

  • 范数
  • 内积
  • 长度与距离
  • 角度与正交性
  • 标准正交基
  • 正交补
  • 函数的内积
  • 正交投影
  • 旋转
  • 进一步阅读

4. 矩阵分解

  • 行列式与迹
  • 特征值与特征向量
  • Cholesky 分解
  • 特征分解与对角化
  • 奇异值分解
  • 矩阵近似
  • 矩阵谱系
  • 进一步阅读

5. 向量微积分

  • 一元函数的导数
  • 偏导数与梯度
  • 向量值函数的梯度
  • 矩阵的梯度
  • 求导的有用公式
  • 反向传播与自动微分
  • 高阶导数
  • 线性化与多元泰勒级数
  • 进一步阅读

6. 概率与分布

  • 概率空间的构造
  • 离散与连续概率
  • 概率的加法规则、乘法规则与贝叶斯定理
  • 统计量与独立性
  • 高斯分布
  • 共轭与指数族
  • 变量变换/逆变换
  • 进一步阅读

7. 连续优化

  • 使用梯度下降进行优化
  • 约束优化与拉格朗日乘数
  • 凸优化
  • 进一步阅读

第二部分:机器学习的核心问题

8. 模型与数据相遇

  • 数据、模型与学习
  • 经验风险最小化
  • 参数估计
  • 概率建模与推断
  • 有向图模型
  • 模型选择

9. 线性回归

  • 问题表述
  • 参数估计
  • 贝叶斯线性回归
  • 最大似然作为正交投影
  • 进一步阅读

10. 主成分分析降维

  • 问题设置
  • 最大方差视角
  • 投影视角
  • 特征向量计算与低秩近似
  • 高维数据中的 PCA
  • 实践中的 PCA 关键步骤
  • 潜变量视角
  • 进一步阅读

11. 高斯混合模型密度估计

  • 高斯混合模型
  • 参数学习与最大似然
  • EM 算法
  • 潜变量视角
  • 进一步阅读

12. 支持向量机分类

  • 分离超平面
  • 原始支持向量机
  • 对偶支持向量机
  • 核函数
  • 数值解法
  • 进一步阅读

mml-book.pdf

已完成内容

第三、四、六、八、十、十二章的初步翻译工作。目前计划同步进行翻译和审校工作

❗❗❗注意事项❗❗❗:为了便于我们跟你取得联系,请务必加我们的微信:at-Sm1les(备注你来自于项目立项即可),发起立项申请后DOPMC成员将会在7天内给出审核意见并评论在该Issue,若7天内无反对意见则默认立项通过,如有任何疑问或者需要帮助均可随时联系微信:at-Sm1les

  • 我已知悉上述注意事项并添加了微信:at-Sm1les
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

2 participants