Pandas初识

 

什么是Pandas

Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

Pandas擅长什么

  • 轻松处理浮点与非浮点的缺失数据
  • 通过DataFrame或者更高维的对象可以完成列的增加与删除
  • 自动和显式地完成数据对齐
  • 强大且灵活的group by功能可对数据集执行拆分应用组合操作,用于聚合和转换数据
  • 轻松的将Python中的ragged, differently-indexed以及numpy数据结构转为DataFrame对象
  • 可以对大数据集上完成基于智能标签的切片,花式索引和子集
  • 直观的合并和连接数据集
  • 灵活的重塑和数据集的旋转
  • 轴的分层标记(可能每个标记有多个标签)
  • 健壮的IO操作,包括对csv文件、excel文件、数据库以及HDF5格式文件的读和写
  • 完成时间序列的特定功能,如:日期范围生成和频率转换,移动窗口统计,移动窗口线性回归,日期偏移和滞后等

 

0

发表评论

电子邮件地址不会被公开。 必填项已用*标注

微信扫一扫

微信扫一扫

微信扫一扫,分享到朋友圈

Pandas初识
嘿!有什么能帮到您的吗?
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close