大数据文摘作品 转载具体要求见文末
作者|Nam Vu 选文|寒小阳
翻译校对|Mirra 吴蕾 寒小阳
◆ ◆ ◆
这是什么
作者受 Google Interview University 启发而写了这个教程。
作为一名移动开发人员,这是我做的向机器学习工程师转型的学习计划,需要花费几个月时间去完成。我的主要目的是要找到合适的学习方法,以及适合于初学者入门的的数学知识摘要和一些实践类的指导。这并非常规途径,而是自上而下的,专注于结果的方法,专为软件工程师而设计的。
如果你有任何建议,请不吝指出,使之更趋完善。
先花几分钟看看目录,再继续往下读:
因本文中有大量的课程链接,不方便呈现,因此,有兴趣者可以戳下方阅读原文,根据原文查找相关内容,获取学习计划checklist
◆ ◆ ◆
目录
· 这是什么?
· 为什么要用此方法?
· 如何运用?
· 跟我来
· 不要觉得自己不够聪明
· 关于视频资源
· 预备知识
· 每日计划
· 激励
· 机器学习概述
· 精通机器学习
· 机器学习的乐趣
· 机器学习:深度非技术指南
· 典故和经验
· 初学者丛书
· 实用丛书
· Kaggle知识竞赛
· 视频
· 慕课
· 成为Open Source贡献者
· 社区
· 我所仰慕的公司
◆ ◆ ◆
为什么要用此方法?
我准备按照这个学习计划,为我未来的工作去做些准备。从2011年开始,我就一直在做移动应用开发(Adroid/iOS/Blackberry)。我大学学的是软件工程专业,并非计算机科学,学过一些基础课程:微积分,线性代数,离散数学,概率和统计等。我对机器学习的兴趣在以下方面:
-
可以的,不过还是比真正进入到这个领域后的难度要高。
-
我正在为我的团队寻找机器学习专家,不过你的慕课学习没法给你送去一份工作(后面有一些好消息)。事实上,很多机器学习专业的硕士也找不到相关工作,因为他们对此没有深入理解,无法帮我解决问题。
-
首先,你必须拥有良好的计算机科学/数学背景。机器学习是个很先进的学科,所以大多数教科书都是基于你已经有了这方面的基础而编写的。其次,机器学习是个通用的课程,里面有细分了很多不同方向的专业,需要有专业技术知识。你可以去浏览一下MS program的机器学习方面课程和教科书。
-
统计,概率,分布式计算。
我感觉这对我有难度。
就我所知,机器学习有两方面:
· 机器学习实践:主要是数据库查询,数据清理,写一些脚本来转换数据,把算法和library并起来,通过自定义代码,从定义不清晰的很难的问题里面最终挤出一些可靠的答案。这就是混乱的实际情况。
· 机器学习理论:这是关于理想状态下的研究,也就是说研究数学的,抽象的,理想情况下的,有限制的,美好的,可能的情况。这是完全排除了混乱的实际情况之后,非常干净的理想状态。
我觉得,关于以实用为导向的最好学习方法,莫过于“实践-学习-实践”,就是说,学生在项目中遇到了实际问题,先熟悉一下这个领域的传统方法。在练习了一段时间有了基本经验后,他们可以看书学习这方面的理论,来指导未来的进阶练习,提升解决实际问题的能力。学习理论知识能够进一步提高对于基础经验的理解,使他们更快得掌握更先进的技能。
这对我来说是一个长期计划,会需要几年时间去完成。如果你对这方面已经比较熟悉了,那会大大缩减所需时间。
◆ ◆ ◆
如何运用
下面都是轮廓性的描述,你要从头到尾逐项进行。
我喜欢用Github的Markdown来写,包括任务列表来检查进度。
创建一个分支,检查好了就打个叉。
◆ ◆ ◆
跟我来
我是个越南的软件工程师,非常向往到美国工作。我正在学习的过程中。你知道我付出多少努力吗?白天忙碌工作后,每晚还要花4小时进行学习。
◆ ◆ ◆
不要觉得自己不够聪明
学习了那些微积分,推论统计,线性代数那些预备课程后,我非常失望,因为我还是不知如何起步……可以看看下面的链接:(鉴于微信后台无法外链,请点击阅读原文获得所有外链资料)
关于视频资源
你注册Coursera或EdX课程后,可以获得一些视频,而且是免费的。不过不开课的时候就无法访问,你得等上几个月。我将会添加更多的视频到公开的资源库里面,来代替过期的在线课程视频。我喜欢用大学公开课。
◆ ◆ ◆
预备知识
在每日计划执行之前,我先学习了一些比较基础而有趣的短篇
每日计划
完全理解一个课题,都不是需要一整天的,你可以在一天里面分多个时段来完成。
每天我会从任务表里面挑一个课题,阅读,做笔记,做练习,并用Python 或R来写代码。
◆ ◆ ◆
激励
机器学习概述
精通机器学习
机器学习的乐趣
机器学习:深度非技术指南
典故和经验
-
如何做半年内成为数据科学家:一名黑客的职业规划方法
初学者丛书
◆ ◆ ◆
实用丛书
Kaggle知识竞赛
Video SerieS
MOOC
-
由神经网络先驱者Geoffrey Hinton讲授
资源
成为OPen Source贡献者
社区
◆ ◆ ◆
我所仰慕的公司
注:因本文中有大量的课程链接,不方便呈现,因此,有兴趣者可以戳下方阅读原文,根据原文查找相关内容,获取学习计划checklist。
关于转载 如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘|bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:[email protected]。
◆ ◆ ◆
志愿者介绍
大数据文摘后台回复“志愿者”,了解如何加入我们
◆
◆ ◆往期精彩文章推荐,点击图片可阅读
怎样找到一份深度学习的工作 | 附学习材料,资源与建议
文章评论