开篇

张宏伦,何许人也?上海交通大学的博士生。在我看来,他是一枚”真的大牛“。《全栈数据工程师养成攻略》足见他的”大牛“本性,这个系列课程不在于它有多难(不过,我相信厚积才能薄发,而一切把知识讲的不知所云才是耍流氓),而在于他精准的实现了课程期望达到的效果:

  1. 面向广大群众,之前有无相关基础皆可,力求在每期视频中讲清楚每一个点;
  2. 视频长度控制在15分钟以内(严格地讲,部分视频并没有在15分钟内,但是一点也没影响轻松学习的效果),这样大家看起来比较轻松,随便听听一期视频就结束了,所讲到的东西也掌握了。

这两个效果对我来说特别明显。比如,以前,通过网络我也学习过python的爬虫,可惜没有一次顺利爬出来结果的,总会遇到各种问题。遇到的问题如此之多,以至于我都以为自己太小白了,而网上所谓的高手都骗人的。这个系列教程让我明白,爬虫能成功,首先是因为网页没有意识到被你爬,或者不介意被你爬,甚至愿意让你爬。其次,要想爬成功,还要你对网页构架有一定的了解。爬虫失败,往往是因为网站注意到了,或者介意一直总是被爬,更改了网页架构,而我们又不懂网页编辑造成的。知道了这点,我才明白爬虫失败,并不是因为高手是骗子,尽管网上随便粘贴的高手实在不少,更多的是因为我太小白了。此外,我也学过一点SQL的知识,但是总不太明白它的用途。这个课程,让我初步了解了SQL的用途,同时让SQL与现有的知识连接起来了。

事实上,更重要的是,课程让我从数据分析的角度梳理了自己的知识。这个课程在数据分析和存储部分是通过python实现的,而我比较多使用R,所以特别希望能够通过R实现课程中的内容。所幸,结合自己的知识和网上的搜索,通过R实现了课程的几个案例:西游记用字统计、爬取豆瓣电影数据和用R操作MySQL数据库。《跟着宏伦学习全栈工程师》系列博文主要介绍了这些案例在R中实现的过程,然而,终究水平所限,部分案例只是实现了需求,并不清楚深层次的原因,还希望大家指教。此外,毕竟python和R各有所长,加上我的知识有限,这个系列博文可能最终只有这三个案例的实现。如果大家有了后续课程中案例在R中的实现方案,希望不吝赐教。

此外,张宏伦的这个系列课程已经在陈堰平老师的雪晴数据网上上线了。以前,我在学习R的过程中,也从雪晴数据网上学到了好多知识。最后,特别希望我的这个系列博文能作为张宏伦课程的后续延伸投稿到雪晴数据网上。

Previous     Next Xu Kuang /
Published under (CC) BY-NC-SA in categories 跟着宏伦学习全栈工程师  tagged with R