-
Які назви стовпців файлу даних?
name=read.csv("hw1_data.csv") names(name)
output:
> name=read.csv("hw1_data.csv") > names(name) [1] "Ozone" "Solar.R" "Wind" "Temp" "Month" "Day"
-
Виведіть перші 6 строк фрейму даних.
head(name, 6)
output:
> head(name, 6) Ozone Solar.R Wind Temp Month Day 1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 5 NA NA 14.3 56 5 5 6 28 NA 14.9 66 5 6
-
Скільки спостерігань (строк) в дата фреймі?
nrow(name)
output:
> nrow(name)
[1] 153
-
Виведіть останні 10 строк дата фрейму
tail(name, 10)
output:
> tail(name, 10) Ozone Solar.R Wind Temp Month Day 144 13 238 12.6 64 9 21 145 23 14 9.2 71 9 22 146 36 139 10.3 81 9 23 147 7 49 10.3 69 9 24 148 14 20 16.6 63 9 25 149 30 193 6.9 70 9 26 150 NA 145 13.2 77 9 27 151 14 191 14.3 75 9 28 152 18 131 8.0 76 9 29 153 20 223 11.5 68 9 30
-
Як багато значень «NA» в стовпці «Ozone»?
sum(is.na(name[,"Ozone"]))
output:
> sum(is.na(name[,"Ozone"])) [1] 37
-
Яке середнє (mean) стовпця «Ozone». Виключити «NA» значення.
mean(name[,"Ozone"], trim=0, na.rm=TRUE)
Output:
> mean(name[,"Ozone"], trim=0, na.rm=TRUE) [1] 42.12931
-
Виведіть частину набору даних (subset) зі значенням «Ozone» > 31 та «Temp» > 90. Яке середнє (mean) значень «Solar.R» в цьому наборі даних (subset)?
my_subset<-subset(name, Ozone > 31 & Temp > 90) my_subset mean(my_subset$Solar.R)
output:
> mean(my_subset$Solar.R) [1] 212.8
-
Яке середнє значення (mean) для «Temp» для червня («Month» дорівнює 6)?
mean(subset(name, Month == 6)$Temp)
output:
> mean(subset(name, Month == 6)$Temp) [1] 79.1
-
Яке максимальне значення «Ozone» для травня («Month» дорівнює 5)?
max(subset(name, Month == 5)$Ozone, na.rm=TRUE)
Output:
> max(subset(name, Month == 5)$Ozone, na.rm=TRUE) [1] 115