栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI
有一份机器学习PPT,在Reddit论坛获得了墙裂欢迎,一日之间揽下400分。
这份PPT来自伯克利CS 189/289课程,从线性代数复习,到线性回归、随机森林、Boosting……各种方法与其中的知识要点全面覆盖,简洁明晰。
在这些词条里,任选一个往下划,都会发现许多宝藏。
比如,下面就是高斯判别分析 (GDA) 。里面讲到了生成模型,模型里的假设,以及不同方法之间的对比。
前往课程主页,就可以把课件与各种配套资料搭配食用;伯克利还把课件的源码放上了GitHub。
那么,一起来观赏一下这份入门佳品。
“给你指了条明路”作为一门友好的基础课,当然要从零开始。
Introduction章节,先介绍了各式各样的机器学习任务:回归、分类、密度估计、降维......
又介绍了监督、半监督、无监督、强化学习,这些不同的学习方式。
然后,一张美好的地图在眼前展开,这是用scikit-learn玩转各种任务的路线图。
△ 回归、分类、聚类、降维
从原点出发,按图索骥,就能到达希望的终点。
比如分类任务上,可能用到支持向量机 (SVM) 。
这时候,翻一下支持向量机的词条:
它会告诉你,逻辑回归解决不了问题,支持向量机或许可以。
原理,用法,以及通常拿来做怎样的任务,都在这里了。
再比如,决策树/随机森林,也是分类方法。
方法背后的理论,用到的split函数,贪心算法等等,这里都会娓娓道来。
如果感觉PPT的介绍太简约,还可以搭配168页课程笔记食用。
笔记一共有23章,课件上的每个词条,几乎都能找到相应的章节。比如,最后一个词条Boosting,就对应笔记里的第24章。
打开这个章节,任意翻到一页:
文字详尽,人类易懂,插图优雅。
从权重初始化开始,Adaboost的每一步都有介绍。
另外,为什么要用Boosted Tree,也是条分缕析:一是快,二是不用搜索超参数,三是偏差方差权衡容易做……
这样一来,刚入坑的你,也可以愉快地学习了。
去吧,皮卡丘除了PPT和笔记之外,课程主页上还有作业和考卷,可以用来检测你的学习成果。
那么,现在就开始学习吧。
PPT传送门:
/#/
CS 189/289课程笔记:
CS 189/289课程主页:
/
GitHub传送门:
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态