教育行业A股IPO第一股(股票代码 003032)

全国咨询/投诉热线:400-618-4000

数据分析工具Pandas:常用的统计计算

更新时间:2022年11月02日15时11分 来源:传智教育 浏览次数:

好口碑IT培训

  Pandas为我们提供了非常多的描述性统计分析的指标方法,比如总和、均值、最小值、最大值等。接下来,笔者来罗列一些常用的描述性统计方法,以及它们的具体说明。

  1.sum:计算和

  2.mean:计算平均值

  3.median:获取中位数

  4.max、min:获取最大值和最小值

  5.idxmax、idxmin:获取最大和最小索引值

  6.count:计算非NaN值的个数

  7.head:获取前N个值

  8.var:样本值的方差

  9.std:样本值的标准差

  10.skew:样本值的偏度(三阶矩)

  11.kurt:样本值的峰度(四阶矩)

  12.cumsum:样本值的累计和。

  13.cummin、cummax:样本值的累积最小值和累积最大值。

  14.cumpord:样本值的累计积。

  15.describe:对Series和DataFrame列计算汇总统计。

  下面通过一些示例来演示上述部分方法的使用。例如,创建一个3行4列的DataFrame对象,它的列索引为“a、b、c、d”,具体代码如下。

In [59]: df_obj = pd.DataFrame(np.arange(12).reshape(3, 4),
                               columns=['a', 'b', 'c', 'd'])
         df_obj
Out[59]:
   a  b   c   d
0  0  1   2   3
1  4  5   6   7
2  8  9   10  11

  然后,让DataFrame对象依次调用sum()、max()和min()方法,分别执行求和、求最大值和最小值的运算,具体代码如下。

In [60]: df_obj.sum()      #计算每列的和
Out[60]:
a    12
b    15
c    18
d    21
dtype: int64
In [61]: df_obj.max()      # 获取每列的最大值
Out[61]:
a     8
b     9
c    10
d    11
dtype: int32
In [62]: df_obj.min(axis=1)   # 沿着横向轴,获取每行的最小值
Out[62]:
0    0
1    4
2    8
dtype: int32

  通过结果可以看出,DataFrame默认优先以纵向轴进行计算,除非在调用这些统计方法时,显式地指明沿着横向轴方向,即aixs=1,才会对每行的数据进行计算。

0 分享到:
和我们在线交谈!