你好,我是陈旸。
我从去年十一前开始准备专栏,到今年3月底樱花飞舞的季节,转眼之间,专栏的内容已经全部更新完毕了。这期间将近有200天的时间,而专栏的更新也有100多天。非常开心能与大家度过这100多天的时间,这段时间里我看到了你们学习的热情,有很多同学认真做总结笔记,并分享出来,还有同学认真手绘专栏的思维导图,实践每一段代码……所有这些都让我看到了你们学习的热情。
我也要感谢洆洆的妈妈(我的老婆),当我准备专栏的时候,洆洆是一个不到6个月的宝宝,只有在夜晚洆洆睡着的时候,我才能开始录音工作。最应该感谢的就是我的老婆,她一个人带孩子。本来晚上回家我可以分担一些,不过为了让我安心地准备专栏,她晚上都是一个人哄宝宝睡觉。
同时,也要感谢我们的编辑和运营的同事。为了保证文章语义的准确和通俗易懂,编辑对每一篇文章都进行认真地修改,插图部分更是自己手绘出来的。多亏了运营,才有了大家互相交流的平台。
回想起来,这些经历依然历历在目。我很庆幸能与你们共同度过这段学习时间。从我最开始准备专栏的时候,我就在想,我希望通过专栏交付什么。我希望你通过专栏,不仅仅可以获得知识,掌握工具的使用,更希望你能得到思维和实战经验的提升。
当大家都在讲知识和工具的时候,我更希望你重视思维和实战。因为知识和工具是别人的,思维和实战才是自己的。
以我自己的经历来说,我从10岁开始编程,从最开始的Basic语言学起,再到Pascal、C++、Java、PHP和Python。每种语言的学习切换基本上2天就可以完成,因为它们有很多共同的地方,不同地方仅仅在于第三方库和使用的框架。
如果我们只关注知识和工具的话,你会发现这些东西更新迭代的速度非常快。可能刚掌握了一个工具,新的工具又出来了。所以我们更应该关注那些不变的东西。
从数据分析的角度上来说,当我们刚从书本上学完了数据挖掘算法之后,你会发现又出现了深度学习。这两年深度学习框架,比如TensorFlow、Keras、Caffe大行其道,于是无数讲人工智能的课诞生了,而这些课基本上都是在给你讲解语法和工具的使用。
当大家都在贩卖知识和焦虑的时候,我更希望你能有独立思考的能力。深度学习固然很火,但本质上,仍然是机器学习的一种,都是帮我们创建分类器。你可以把传统的机器学习理解是专家级的方式,我们观察数据符合哪些特征,然后用各种分类、聚类算法处理这些数据。算法都是我们事先指定的。同样,深度学习更像一个黑盒子,我们无须事先指定提取特征的方法,而是通过深度学习这个大脑让机器自我训练,完成特征的提取。
当你开始思考这些方法之间的共同和差异点的时候,你将会收获更多。首先,你无须为新工具的出现产生无畏的焦虑感,因为每个工具都有适用的条件,深度学习虽然普适性强,但是对数据量的依赖性大,计算量大,收敛时间慢。在数据量不大的情况下,采用传统的机器学习可以更快收敛,同时还能得到不错的结果。
当你对这些知识和工具建立不同思考的时候,你更有可能理解和掌握它们。因为这些知识和工具的相同点,就会更容易完成知识和工具的迁移。它们的差异性可以让你更加了解每个知识和工具的特点。
所以当知识和工具爆炸出现的时候,我希望你不要随波逐流,可以独立思考,与这些东西建立多维度的连接。
同时,实战也是重要的成果体现。这就好比学习开车一样,学会开车和自驾旅行是完全不同的体验。只有通过实战,你才能解决一个特定的问题,领略到路途中的风采,为你的项目简历增加光彩的一笔。
知识和工具是别人的,而思维和实战是自己的。那么在提升思维和实战经验的过程中,我希望你能掌握适合的方法。
我见过很多人,选了很多课,自己也很努力,但是收获的效果一般。实际上,好的学习方法比努力更重要。
我在专栏的开篇和结束的时候都提到了提问和分享,在开篇中也讲到了MAS学习法。实际上我们不是单向地被动接受知识和工具,更要建立思考和连接。建立多维度的连接,一个最好的方式就是学会提问以及学会分享。分享就好比是在测试集上做验证。分享的过程就是重新梳理知识的过程,还能得到别人的反馈,既受益别人,也获益自己。
当我们建立了正确的学习方法之后,你会发现投入越多,收获越多。
在专栏更新的过程里,我很高兴地看到,有些同学自己开始用工具分析王者荣耀的英雄属性,分析他们之间的关联;也看到有同学在用ARMA模型对股市指数进行预测,使用爬虫抓取数据……
如果说工作是公司的事情,那么思维和实战经验的积累则是自己的事情。在思考和实战这条道路上,投入越多,收获就会越多。我看到在不少文章的评论区,都有同学们自己总结的笔记,还有人把实战的代码放到了GitHub上。这都是在为自己的体验负责。
专栏本身只是一个开始,虽然专栏文章已经更新完毕,但大家的笔记分享不会结束。
不论你以后是否会从事一份和数据分析相关的工作,我都希望你可以把思考作为一种学习的领悟,把实战当做是一次项目的旅行。在思维和实战经验上,有些许的提升。