Я новичок в R и пытаюсь выполнить задание.
Один из вопросов, который мне нужно решить, заключается в следующем:
#Q3 Сколько наблюдений не приобрели книги (включая Флоренцию)? Удалите эти наблюдения, прежде чем перейти к следующему шагу.
Я считаю, что должен решить эту проблему с помощью функции, предоставленной из пакета dplyr, но я очень не понимаю, какую из них использовать.
Пример данных:
```{r echo=TRUE}
library(dplyr)
library(tidyr)
library(ggplot2)
library(readxl)
doc <- as.data.frame(read_excel("path/doc.xls"))
doc <- cbc[,3:ncol(doc)]
str(doc)
summary(doc)
```
```
Count the unique values of each variable.
Q1 How many observations are in the dataset?
Q2 List the variables and show their type
```
```{r}
doc_counts <- doc %>% summarise_all(~(n_distinct(.)))
doc_counts
```
```
#Q3 How many observations have no books purchased (including Florence)? Delete those observations before proceeding to the next step
```
```{r}
//answer to go here
```
Кажется, я смутно знаю, как удалить наблюдения с помощью функции фильтра. Я просто не понимаю, как мне определить, сколько наблюдений без купленных книг?
Любая помощь очень ценится.
Я пробовал использовать summarise_all()
, summarise_if ()
и другие вещи, которые искал, но больше не помню, потому что не мог понять, как заставить это работать.
Я не совсем уверен, что мне стоит ожидать увидеть. Мои инструкции в классе очень расплывчаты.
Используя пакет dplyr
:
ChildBks
, YouthBks
, Florence
), равны нулю.filter()
, чтобы выбрать строки, в которых все столбцы, связанные с книгой, равны нулю.n()
, чтобы подсчитать, сколько строк соответствует этому условию.# Count the number of observations with no books purchased
no_books_count <- doc %>%
filter(ChildBks == 0 & YouthBks == 0 & Florence == 0) %>%
n()
# Print the number of observations with no books purchased
print(no_books_count)
# Remove those observations from the dataset
doc_filtered <- doc %>%
filter(!(ChildBks == 0 & YouthBks == 0 & Florence == 0))
Надеюсь, это поможет!
Большое спасибо!! Я изучу это!! но спасибо, что сэкономили мне больше часов без сна, хаха :')
конечно, рад помочь! :)
Поскольку это задание, я считаю, что вам, вероятно, следует поработать над ним самостоятельно. Для подсказки: у вас есть три столбца с количеством купленных книг в разных категориях. Попробуйте создать новый столбец с общим количеством книг, купленных каждым человеком, и отфильтровать его, чтобы получить строки, в которых общее количество не равно нулю.