集团主站
欢迎来到成都达内官方网站!达内—美国上市公司 亿元级外企IT培训企业!
成都it培训哪家好
成都it培训哪家好
全国服务监督电话:15023458194  |   联系客服   |
当前位置:主页 > 培训课程 > Python >

成都Python培训:python数据分析-数据索引

发布者: 成都达内     浏览次数:     发布时间:2020-07-27 13:52:55

数据索引是数据分析中最关键的操作。在数据分析中经常需要选取固定的行列,在Excel中可以使用鼠标进行点选,但是敲命令的时候,例如python和R中不方便使用鼠标,这就需要灵活掌握...

  数据索引是数据分析中最关键的操作。在数据分析中经常需要选取固定的行列,在Excel中可以使用鼠标进行点选,但是敲命令的时候,例如python和R中不方便使用鼠标,这就需要灵活掌握数据的索引。如果数据索引不能熟练操作,就看不懂代码,后面的数据分析无法完成。

  数据索引

  数据索引,也称为数据切片和切块,是使用不同的列或索引切分数据,实现从数据中获取特定子集的方式。DataFrame为二维数据,每一列均为一个同一类型数据,所以为Series,每一行可以为不同数据类型,所以,每一行数据为DataFrame一个子集,数据类型依然为DataFrame。

  pandas索引常用五种方法,loc iloc ix at iat。ix官方已不再推荐使用。其实笔者觉得pandas的索引操作不如R的方便。不过也够用。目前主要使用的为loc和iloc,两者比较容易混淆,这里按照官方方法提供一个简单的快速记忆方法loc代表location,使用标签来索引,也就是行名或者列名,而iloc中的i解读为integer,即integerlocation通过数字索引值来定位,也就是行号或者列号。

  x.loc[ [‘行名1’, ‘行名2’, ‘行名3’……] , [‘列名1’,‘列名2’……] ]

  x.iloc[ [行号1,行号2,行号3……] , [列号1,列号2……] ]

  利用数字进行索引

  pandas可以使用行名列名进行索引,也可以使用数字作为索引,具体使用哪种方式,要看具体使用场景,灵活使用,如果行列数太多,使用行名列名更加方便,如果要选取一个范围,使用数字更加方便。

  如果要使用数字进行索引,则需要使用iloc标签,行在前列在后,中间用逗号“,”分割,如果全部选取,用冒号“:”代替。其中冒号也可以用来表示一定范围。

  特别注意, python中索引值从0开始。并且不包含右侧边界。例如0:15,代表从第一个值到第15个值。

  成都Python培训:python数据分析-数据索引

  使用数字索引

  mtcars[0:5]

  mtcars.iloc[ 0:5 ,: ]

  mtcars.iloc[1]

  #负数索引

  mtcars.iloc[:,-1]

  选取奇数行和偶数行

  #奇数行

  mtcars.iloc[np.arange(0,32,2)]

  #偶数行

  mtcars.iloc[np.arange(1,32,2)]

  利用行名列名进行索引

  如果想选取固定的行,使用点号,是最方便的方式,类似于R中数据框索引使用“$”,为什么行不行呢?因为数据分析中更多时候是按列处理数据。这里注意由于python中点号有特殊作用,所以,源文件列名中最好不要有点号和空白,可以使用下划线替代

  mtcars.cyl

  mtcars.cyl.size

  直接使用行名列名选取数据

  mtcars['mpg']

  mtcars[['mpg','cyl']]

  mtcars.loc[:,['cyl']]

  mtcars.loc[['Fiat 128','Valiant']]

  mtcars.loc[:,['disp','hp']]

  删除固定行或列

  #删除行列

  mtcars.drop(columns=['cyl','mpg'])

  mtcars.drop(index=['Valiant'])

  mtcars[mtcars.index != 5]

  mtcars[mtcars.index!='Volvo 142E']

(责任编辑:范老师)
最新开班
  • 成都Java培训班
    免费试听名额发放中...
  • 成都C++培训班
    免费试听名额发放中...
  • 成都PHP培训班
    免费试听名额发放中...
  • 成都网络工程培训班
    免费试听名额发放中...
  • 成都Unity3D培训班
    免费试听名额发放中...
  • 成都大数据培训班
    免费试听名额发放中...
  • 成都uid培训班
    免费试听名额发放中...
  • 成都会计培训班
    免费试听名额发放中...
  • 成都Python培训班
    免费试听名额发放中...
  • 成都嵌入式培训班
    免费试听名额发放中...
  • 成都web培训班
    免费试听名额发放中...
  • 成都软件测试培训班
    免费试听名额发放中...
在线留言
提交

校区地址:成都市锦江区东大街紫东楼端35号明宇金融广场19楼1906室

联系电话:15023458194

公交路线:芷泉街(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:成都市高新区奥克斯广场蜀锦路209号一楼商铺

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

校区地址:成都锦江区东大街芷泉街229号东方广场C座3楼303

联系电话:15023458194

公交路线:芷泉街(188路;115路;515路;236路;505路;501路;84路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:成都市武侯区佳灵路3号红牌楼广场2号写字楼11楼1115号

联系电话:15023458194

公交路线:红牌楼东(11路;92路;100路;111路;139路;g28路;快速公交K1/K2) 地铁路线:红牌楼站(地铁3号线)

校区地址:成都市锦江区红星路二段70号四川日报大厦502-2

联系电话:15023458194

公交路线:市二医院站(6路;49路;102路;5路;37路;g92路;) 地铁路线:地铁市二医院(地铁3号线)

校区地址:成都市锦江区东大街芷泉段229号东方广场C座16层

联系电话:15023458194

公交路线:芷泉街(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:东门大桥站(地铁2号线)

校区地址:四川省成都市武侯区高新科技孵化园9号园区E座7楼

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

校区地址:成都市高新区奥克斯广场B座1708

联系电话:15023458194

公交路线:益州大道锦城大道口(18路;21路;43路;48路;104路;152路;335路 ) 地铁路线:孵化园(地铁1号线)

了解达内动态
关注成都达内教育公众号

首页 | 关于达内 | 课程中心 | 专家师资 | 视频教程 | 学员空间 | 校企合作 | 新闻资讯 | 就业指导 | 网站地图

2016-2025 达内时代科技集团有限公司 版权所有 京ICP证8000853号-56