6 小时 Python 入门 以下操作均在 Windows 环境下进行操作,先说明一下哈 一、安装 Python1、官网下载 Python 进入官网(https://www.python.org),点击 Downloads,选择要下载的版本: 2、安装 Python 安装时...2023-09-25程技
Anaconda 入门指南一、下载安装 Anaconda1、下载地址:Anaconda 推荐下载 python3 版本, 毕竟未来 python2 是要停止维护的。 2、安装 Anaconda 按照安装程序提示一步步安装就好了, 安装完成之后会多几个应用: Anacon...2023-09-25程技
Jupyter添加目录toc最近在使用Jupyter notebook的时候感觉到,没有个目录真心难受,当想查找需要的函数的时候,不能很快速的找到,这个时候,要是有个目录就好很多了,很不幸的是,默认Jupyter notebook事没有生成目录这个功能的,但很巧的是,有人已经开...2023-09-25程技
第三章 Python 的数据结构、函数和文件 🐹 本章讨论Python的内置功能,这些功能本书会用到很多。虽然扩展库,比如pandas和Numpy,使处理大数据集很方便,但它们是和Python的内置数据处理工具一同使用的。 我们会从Python最基础的数据结构开始:元组、列表、字典和集合。然...2023-09-25程技
第五章 Pandas 入门pandas是本书后续内容的首选库。它含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。pandas经常和其它工具一同使用,如数值计算工具NumPy和SciPy,分析库statsmodels和scikit-learn,和数据可视化库matp...2023-09-25程技
第六章 数据加载、存储与文件格式访问数据是使用本书所介绍的这些工具的第一步。我会着重介绍pandas的数据输入与输出,虽然别的库中也有不少以此为目的的工具。 输入输出通常可以划分为几个大类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据,利用Web API操作网络资源。...2023-09-25程技
第七章 数据清洗和准备在数据分析和建模的过程中,相当多的时间要用在数据准备上:加载、清理、转换以及重塑。这些工作会占到分析师时间的80%或更多。有时,存储在文件和数据库中的数据的格式不适合某个特定的任务。许多研究者都选择使用通用编程语言(如Python、Perl、R或Ja...2023-09-25程技
第九章 绘图可视化信息可视化(也叫绘图)是数据分析中最重要的工作之一。它可能是探索过程的一部分,例如,帮助我们找出异常值、必要的数据转换、得出有关模型的idea等。另外,做一个可交互的数据可视化也许是工作的最终目标。 Python有许多库进行静态或动态的数据可视化,但...2023-09-25程技
第八章 数据规整:聚合、合并和重塑在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析。本章关注可以聚合、合并、重塑数据的方法。 首先,我会介绍pandas的层次化索引,它广泛用于以上操作。然后,我深入介绍了一些特殊的数据操作。在第14章,你可以看到这些工具的多种应...2023-09-25程技