互联网的飞速发展伴随着海量信息的产生,而海量信息的背后对应的则是海量数据。如何从这些海量数据中获取有价值的信息来供人们学习和工作使用,这就不得不用到大数据挖掘和分析技术。数据分析作为大数据技术的核心一环,其重要性不言而喻。
在数据分析领域,Python语言以其简单易用,并提供了优秀、好用的第三方库和数据分析的完整框架而深受数据分析人员的青睐。可以说,Python已经当仁不让地成为了数据分析人员的一把“利器”。程序员想要进入数据分析行业,首先要掌握Python数据分析技术,只有这样才能在严峻的就业市场中具有较强的竞争力。
目前图书市场上关于Python数据分析的图书主要是几本翻译图书,其定位相对高端,而且翻译质量参差不齐,案例数据不方便下载,阅读难度系数较大,初学者不容易上手,故不适合初学者学习;而国内的几本原创Python数据分析图书质量也良莠不齐,不成系统,也不适合初学者阅读。可以说,图书市场上还鲜见一本通俗易懂且适合“小白”阅读的Python数据分析入门图书,基于此,笔者编写了本书。本书从Python数据分析的基础知识入手讲解,然后结合大量的数据分析案例,系统地介绍了Python数据分析的方法和流程,手把手带领读者掌握Python数据分析的相关知识,并提高读者的项目实践能力。
本书特色
1.视频教学,高效、直观
为了便于读者高效、直观地学习,笔者专门为本书的重点内容录制了配套教学视频,读者可以一边看书,一边结合教学视频进行学习,以取得更好的学习效果。
2.内容全面,讲解系统
本书不但全面介绍了从Numpy到pandas,从matplotlib到pyecharts的数据分析必学技术,而且还系统地讲解了从数据读取到数据清洗,从数据处理到数据可视化的详细步骤。
3.给出了数据分析环境的安装和配置步骤
本书详细介绍了Python数据分析集成环境Anaconda的安装步骤和使用方法,可以大大降低初学者学习Python数据分析的门槛,从而让读者快速跨进Python数据分析的大门。
4.详细介绍了数据分析的流程
本书从一开始便对数据分析的流程进行了详细介绍,而且在讲解中结合了多个实用性很强的数据分析项目案例,带领读者掌握Python数据分析的相关知识,以解决实际工作中的数据分析问题。
5.提供了9个有较高应用价值的项目案例,有很强的实用性
本书提供了9个实用性很强的数据分析项目案例,这些案例从不同的分析角度切入进行讲解,具有较高的应用价值。读者通过实际操练,可以更加透彻地理解数据分析的相关知识。
6.提供教学PPT,方便教学和学习
笔者专门为本书制作了专业的教学PPT,以方便相关院校的教学人员授课时使用;读者也可以通过教学PPT,提纲挈领地掌握书中的内容脉络。
本书内容
第1章 Python环境搭建与使用
本章介绍了如何搭建和使用Python数据分析环境,并介绍了如何使用Jupyter Notebook进行数据分析编程。
第2章 NumPy入门和实战
本章首先介绍了Numpy的基本数据结构——多维数组;然后介绍了多维数组的创建和基本属性、数组的切片和索引方法,以及数组的运算与存取;最后通过综合案例,演示了如何实现图像的变换功能。
第3章 pandas入门和实战
本章首先介绍了pandas中两种基础数据结构的创建和使用方法;然后详细讲解了DataFrame的选取和操作,同时介绍了其算术运算、函数的使用和pandas的可视化方法;最后结合案例,介绍了数据分析流程。
第4章 外部数据的读取与存储
本章主要介绍了如何利用pandas库读取外部数据为DataFrame数据格式,并介绍了通过Python进行数据处理后如何将DataFrame类数据存储到相应的外部数据文件中。
第5章 数据清洗与整理
本章主要介绍了如何使用pandas进行多源数据的清洗和整理,并给出了针对多源数据的合并和连接方法,以及数据的重塑方法,最后通过一个综合案例演示了数据分析中的数据清洗过程。
第6章 数据分组与聚合
本章涵盖的主要内容有:GroupBy的原理和使用方法;聚合函数的使用;分组运算中transform和apply方法的使用;通过pandas创建数据透视表;通过综合案例,巩固数据分组统计的使用。
第7章 matplotlib可视化
本章涵盖的主要内容有:利用matplotlib进行图表绘制;学会使用自定义设置,个性化绘制图表;通过综合案例,巩固matplotlib可视化的方法和技巧。
第8章 seaborn可视化
本章涵盖的主要内容有:使用seaborn绘图;学会seaborn样式和分布图绘制;通过综合案例泰坦尼克号的生还者数据,巩固seaborn的可视化方法和技巧。
第9章 pyecharts可视化
本章涵盖的主要内容有:安装pyecharts库;学会使用pyecharts库绘制基本图表;学会绘制其他图表;通过综合案例,巩固pyecharts的绘制方法和技巧。
第10章 时间序列