Fork me on GitHub

Udacity数据分析(进阶)学习总结

如果说数据是21世纪的石油,那么数据分析就是对其进行提炼。

今年5月份,我报名了优达学城的数据分析(进阶)纳米学位课程,今天终于完成了四个项目的学习,在快速迭代的新时代下,这种网上学习我认为会变得越来越重要,当然,记录本身也是重要的。

对于学习动机来说,得追溯到2016年的Alpha Go大胜李世石,在这之后,我开始关注人工智能,然后发现应该学习人工智能应该分三步走,数据分析—机器学习—深度学习,所以就开始了数据分析的学习。在这之前,对于编程语言,我只是在大学一年级的通选课上学习了C语言,对于Python可以说是零基础,但是我对计算机很感兴趣,再加上Python比较简单,就直接报了进阶课程,接下来我就详细地说说学习过程。

Python的学习

我先是学习了优达学城的单项课程—计算机科学导论,对计算机和Python编程有了一个初步的认识,再学习了编程基础:Python,对面向对象编程有了一定认识。

之后我又系统地把Python编程:从入门到实践 过了一遍,把其中每行代码都运行了一遍,收获非常大。它里面有三个项目:分别是游戏入侵外星人,数据可视化及Web项目学习笔记。

入侵外星人代码:https://github.com/FreeKnightThinker/Alien-Game

学习笔记代码:https://github.com/FreeKnightThinker/Leaning_log

这样通过这三部分的学习,我对Python编程也有了一定的信心。

##强调:学习的新同学请勿抄袭以下项目代码,仅供参考!!!

项目一:检验心理学现象

项目概述

在此项目中,你将研究一个经典的实验心理学现象,叫做斯特鲁普效应。你将稍微了解该实验,创建关于任务结果的假设,并自己研究该任务。然后查看同样执行了该任务的其他人收集的数据,并计算描述结果的统计学数据。最后,你将用假设来解释你的结果。

项目代码

https://github.com/FreeKnightThinker/Test_a_Perceptual_Phenomenon

学习总结

1、掌握统计学基本概念,特别是假设检验这一块,比如t检验,P值法

2、Python Pandas库和matplotlib的基本操作

推荐资源

  • Udacity推论统计学入门(这门课中除了已经学到的t检验外,还加入了方差分析、回归分析和卡方检验等进阶内容,适合已经通过项目的学员进行深入学习);
  • Coursera专项课程:R语言统计学(Duke大学教授主讲,和Udacity的课程可以互为补充,在某些理论方面探索会更加深入。虽然需要付费做作业,但仅看课程视频就可以学到很多,强烈推荐);
  • 台湾大学顽想学概率(一)(二)(要进一步了解统计学原理,概率论是必不可少的。这门中文MOOC以通俗易懂的内容和讲师幽默随和的风格,自上线以来好评不断,习题也十分有挑战性);
  • 概率论:不确定性的科学(MIT的经典MOOC,一直以来都是Edx上最热门的课程之一,难度和学习强度也相当之大,但授课水平确实无可挑剔,清晰明了。建议空余时间较多并且愿意挑战自己时选修);
  • 陈希孺《概率论与数理统计》(国内比较少见的经典数理统计教材)。

项目二:清洗和分析数据

这个项目主要是了解了数据分析或数据可视化之前要进行数据收集和数据清洗工作,而有时数据收集花费的时间是最长的。

现实世界的数据通常都不干净。使用 Python 以及 Python 的库,你可以收集各种来源、各种格式的数据,评估数据的质量和整洁度,然后进行清洗。这个过程叫做数据整理。

项目代码

https://github.com/FreeKnightThinker/WeRateDogs

学习总结

1、认真完成视频中布置的练习,认真研读解决方案

2、带着问题去处理数据,数据是为解决问题服务的

3、最好学习正则表达式

项目三:探索性数据分析

这个项目主要学习R语言,使用 R 并运用探索性数据分析来探索一个变量或多个变量之间的关系,以及在一个选定的数据集中探索分布、异常值和反常现象。

项目代码

https://github.com/FreeKnightThinker/Explore_and_Summarize_Data

###学习总结

这个项目算是学习一门新课程了,要认真把视频中教程一步步模仿下来。R语言是统计领域常用的编程软件。

推荐资源

R语言实战

ggplot2:数据分析与图形艺术

项目四:讲述一个Tableau故事

项目概述

在此项目中,你将使用 Tableau 创建一个数据可视化,以描述数据故事或突出显示数据集的趋势或模式。你的工作是反映数据可视化的理论和实践,如可视编码、设计原则和有效传达结果。

项目代码

https://github.com/FreeKnightThinker/Tableau_Story

真理和人之间最短的距离就是故事。—— Anthony de Mello, One Minute Wisdom

学习总结

先要学会如何通过数据来讲述一个故事,数据是为故事服务的,应该先构思好一个框架,通过不断地迭代,达到项目的要求。

推荐资源

用数据讲述精彩故事的 5 个最佳实践

哪种图表软件是数据分析的理想选择?

示例 - 一个调查趋势的故事

总结

学习了数据分析,也算是为以后的机器学习打下了基础,我想编程语言以后会变成英语这样的口头语言一样变得必要吧!

Time is changing. Keep go ahead.

本文标题:Udacity数据分析(进阶)学习总结

文章作者:FKT

发布时间:2018年09月09日 - 21:09

最后更新:2018年12月23日 - 19:12

原始链接:https://freeknight.cf/2018/09/09/udacity-data-analysis/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

-------------本文结束感谢您的阅读-------------