100天机器学习实战:22K星的入门圣经,但我劝你先看完这篇再决定
评测MLEveryday/100-Days-Of-ML-Code,一个22K star的机器学习中文教程项目,100天从零入门ML/DL。
广告
说实话,我第一次在 GitHub 上搜机器学习中文教程的时候,这个项目直接蹦到脸上——22K star,标题写着”100天机器学习实战”,中文的。作为一个英文文档看得头疼的人,我当场就点了 Star,然后 clone 下来开始跑。
这项目到底是干嘛的
简单来说,这是一个100天的机器学习学习计划。每天一个知识点,配一个 Jupyter Notebook,从最简单的数据预处理开始,一路走到深度学习。作者是 MLEveryday 社区,整个项目用中文写,对国内新手极其友好。
内容覆盖挺全的:监督学习(线性回归、逻辑回归、SVM、决策树)、非监督学习(K-Means、层次聚类)、深度学习(CNN、RNN 基础),还有数据可视化、特征工程这些基本功。每个知识点都配了代码和一张信息图(infographic),看起来确实很系统。
实际用起来怎么样
我按照它的 Day 1 开始跑,前两周确实挺顺的。Python 基础好的话,基本就是跟着 notebook 一行行敲,然后看输出。代码质量中规中矩,能跑通,注释也够用。
但跑到第 30 天左右,我开始遇到一些问题。有些库的版本太老了,比如 TensorFlow 1.x 的写法,现在装最新版直接报错。还有几张 infographic 在手机上看根本看不清字,得放大到电脑上才能读。
快速上手
如果你还是想试试,上手很简单:
git clone https://github.com/MLEveryday/100-Days-Of-ML-Code.git
cd 100-Days-Of-ML-Code
pip install -r requirements.txt
jupyter notebook
然后打开 Day1 文件夹里的 notebook,跟着跑就行。
优点
- 循序渐进:每天一个主题,不会一下子信息量爆炸
- 中文友好:全中文注释和说明,对英文吃力的同学是福音
- 代码可运行:大部分 notebook 直接能跑,不用自己找数据集
- 涵盖面广:从传统 ML 到 DL 都有涉及,100天下来基础算扎实
缺点
- 更新停滞:最后一次更新是 2022 年,有些库版本已经过时
- 深度学习较浅:CNN、RNN 部分只是入门级别,想深入还得找别的资料
- Infographic 体验差:那些信息图在手机上几乎没法看
- 缺少实战项目:100天都是知识点,没有完整的端到端项目
总结
这个项目适合完全零基础、想系统入门机器学习的人。如果你英文不好,不想啃英文文档,这确实是个不错的起点。但如果你已经有一定的 ML 基础,或者想学到能找工作的程度,100天之后你还得补很多课。
我的建议是:把它当作入门地图,而不是终点。跑完这 100 天,你对机器学习会有个整体概念,然后根据自己的方向(推荐系统、CV、NLP)再深入。
如果你是 2024 年之后才开始学,建议先检查依赖版本,有些代码可能需要小改一下才能跑通。不过核心知识点本身是不会过时的。
关于作者
柳钉鱼,全栈开发者,GitHub 重度用户。过去 3 年 Star 了 900+ 仓库,这里只写我真正用过或深度调研过的工具。
📧 发现好工具想推荐?发邮件到 [email protected]
广告