当前位置: 首页>

【全面】pandas数据分析面试题(五)汇总!

哈喽,大家好,我们今天继续来总结pandas的面试题。

1、pandas查看数据的方法有哪些?

第一种:查看数据的前几行,可以通过输入相应的数据,调整查看的行数:

df.head

第二种:查看数据的后几行,跟head用法一致:

df.tail

第三种:随机查看数据,同样可以在括号中选择不同的数字,调整随机的数量:

df.sample(5)

2、pandas分析数据的方法都有哪些?

1)查看数据的行列数

df.shape

2)查看数据更加详细的信息,比如索引、数据类型和内存信息:

df.info

3)数据统计,通过这个函数可以大致了解平均数、中位数等信息:

df.describe

4)查看各字段类型

df.dtypes

5)查看数据的行和列名

df.axes

3、如何指定特定的行和列?

df.loc[行的范围, 列的范围]

df.iloc[行的索引, 列的索引]

比如df.iloc[:10,:] 代表着前10行

4、分组聚合:

比如下面的意思是,按照xx进行分组,并且求和,还可以按照xx进行分组求平均数等操作:

df.groupby('xx').sum

df.groupby('xx').mean

5、统计函数有哪些?

1)返回列与列之间的相关系数:df.corr

2)返回每一列中的非空值的个数:df.count

3)返回每一列的标准差:df.std

4) 返回方差:df.var

本文来自网络,不代表 立场,转载请注明出处。