Вы находитесь на странице: 1из 2

�����Ӽ �( subsetting)

--ԭʼ��‫�ݣ‬raw dataset��--> Ԥ��������‫�ݣ‬clean dataset��


����
- []:��ȡһ�����������ͬ��Ԫ��
x <- 1:10
x[���õ���Ԫ���±�(��1��ʼ��] -> �����һ��Ԫ�‫�أ‬x[1]��
ǰ���Ԫ�� x[1:5]���ж��� x[x>5];��������ȡ x ["Name"]
-x[x>5 & x<7]
-x > 5 # ���Ϊ����ֵ
-y <- 1:4
-names(y) <- c("a","b","c","d")
-y["b"]
- [[]]:���б����‫�����ݿ‬ ȡԪ��
- $: �����ִ�� б����‫�����ݿ‬ ȡԪ��
*************************************************
�����Ӽ� -> ָ �� Ҫȡ���������е����
x[row,column];
ȡ��‫��ڶ‬е�һ���������
͵ x[2,c(1,3)]��
���뷵�‫����ؾ‬ ǵ����������drop = FALSE���� x[1,2,drop = FALSE]
*************************************************
��‫��ݿ‬Ӽ��� $�������ִ�� б����‫�����ݿ‬ ȡԪ��
x <- data.frame(v1=1:5,v2=6:10,v3=11:15)
��v3�еĵ‫ ��ֵ�ڶ���������ݸ‬x$v3[c(2,4)] <- NA
which�������Щ��Ϊ�棬���������Ԫ��ֵΪ����±�
which��x$v1>2)eg :x[which(x$v1>2),]
x[x$v1>2]#������еȼ�
subset(ĸ���������Ӽ�����)
subset(x,x$v1>2))
*****************************************************
�б���Ӽ�
- [[]]/$[[]][]/[[]][[]]
- Ƕ���б�/����ȫƥ�䣨 partial matching��
- [[�±�/"���"]]/$���/[[]] []/ [[]] [[]]
- �б�ֻ��һ��������Ԫ�����+Ԫ�‫��ֻ�����أ‬ȡԪ�‫���أ‬Ҫ˫���
-Ƕ���б� -> �б�Ԫ�����б������ x[[1]][[2]] OR x[[c(1,3)]]
-����ȫƥ�� -> l$x1 OR x[[x1,exact = FALSE]]
*********************************************************
����ȱʧֵ
- �ж�ȱʧֵ ��is.na(x)
- ȡ������з�ȱʧԪ�� ֵ ��y[!is.na(x)]
- ȡ��������е�ȱʧֵ ��z <- complete.cases(x,y)
x[z] ; y[z]
- ������‫�ݼ‬ʵ��library��datasets�� - ��airquality��
- �鿴 ǰ�������head��airquality��
- g <- complete.cases(airquality)
- ����ȱʧֵ�Ľ�� ��airquality[g,]
-> library(datasets)
> head(airquality)
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1
2 36 118 8.0 72 5 2
3 12 149 12.6 74 5 3
4 18 313 11.5 62 5 4
5 NA NA 14.3 56 5 5
6 28 NA 14.9 66 5 6
> g<-complete.cases(airquality)
> g
[1] TRUE TRUE TRUE TRUE FALSE FALSE TRUE TRUE TRUE FALSE FALSE TRUE
> airquality[g,][1:10,]
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1
2 36 118 8.0 72 5 2
3 12 149 12.6 74 5 3
4 18 313 11.5 62 5 4
7 23 299 8.6 65 5 7
8 19 99 13.8 59 5 8
9 8 19 20.1 61 5 9
12 16 256 9.7 69 5 12
13 11 290 9.2 66 5 13
14 14 274 10.9 68 5 14
> #ȱ�‫����ٵ‬С�ʮ�С�ʮһ�е���‫�������˵�ݣ‬д���ȱʧֵ
******************************************************
���������vectorized operation��
- �������������������Ƚṹ��ʹ�ô���࣬ ������Ķ��Ч�ʸߡ�
- > x<-1:5
> y<-6:10
>
> x+y
[1] 7 9 11 13 15
> #����ӦԪ��������
>
> x<-matrix(1:4,nrow=2,ncol=2)
> y<-matrix(rep(2,4),nrow=2,ncol=2)
> x
[,1] [,2]
[1,] 1 3
[2,] 2 4
> y
[,1] [,2]
[1,] 2 2
[2,] 2 2
> #rep(2,4) ��2�4�‫��ظ‬
>
> x*y
[,1] [,2]
[1,] 2 6
[2,] 4 8
> #x��y��Ӧ��Ԫ�����
>
> x %*% y
[,1] [,2]
[1,] 8 8
[2,] 12 12
> #�����
**************************************
С�᣺
�����Ӽ���[]/[[]][]/$/[[]][[]]
����ȱʧֵ��is.na(x)/complete.cases(x)
���������

Вам также может понравиться