年薪百万的算法工程师给他的审计师朋友写的python入门文档

我有一个在国家审计署的好朋友说要学python。根据他的背景和应用场景,我整理了下面这个入门文档。应用场景是做数据分析,他的基本背景理工科研究生大学时​学过基本的编程。

  1. 安装, 装anaconda, https://www.anaconda.com/ 为什么用anaconda?
    • 默认包含了常用的数据分析和机器学习软件包,​ 开箱即用。
    • 提供spyder, jupyter等多种不同的开发环境,其中jupyter​最适合用于数据分析,我自己最喜欢用。
    • 方便维护多个python环境切换不同python版本​。    
  2. 首先要通过官方文档学习基本的语法: https://docs.python.org/zh-cn/3/tutorial/
  3. 10分钟学习数据分析软件包pandas, 以后可以边google边用: https://pandas.pydata.org/docs/getting_started/10min.html
  4. 学习pyspark处理海量数据, spark是一个分布式并行处理数据的工具,咱们可以用zeppelin来交互式写spark。这个工具不在anaconda里面需要单独安装。下面这个文档整理了从hdfs读取数据处理数据的常用内容http://blog.yeshiwei.com/2020/05/16/zeppelin-pyspark-guide/

PS:

  1. 安装完anaconda自己去google一下你所在的系统怎么打开jupyter.
  2. 有什么问题直接用英文google是最高效的解决方式。

Add a Comment

您的电子邮箱地址不会被公开。 必填项已用*标注