Фрейм данных, импортированный из Excel, обрабатывает "<" как NA

Я импортирую большой набор числовых данных в R из Excel. Данные представляют собой числа химического состава, и я часто получаю значения, например, «<1». Каждый раз, когда у меня есть «<1» во фрейме данных, R считывает / выводит его как NA.

Кажется, это делается при чтении файла excel, поэтому мои попытки использовать gsub для замены "<" на "" не работают, поскольку число с самого начала не обрабатывается как числовое.

Я хотел бы получить эти данные и сделать так, чтобы все, что имеет значение «<1», было просто «1». Но, как я уже сказал, он импортируется как АН, и я не знаю, что делать.

Я новичок в R, поэтому, пожалуйста, смиритесь с моей ограниченной способностью четко определить мою проблему.

Заранее спасибо!

<1 - это не числовые данные, а тип символа. Вы пробовали читать столбец excel как символ?

— 08.01.2019 16:17

Сколько столбцов в наборе данных и сколько из них должно быть числовым? Один из подходов - прочитать все как строку, выполнить замену и привести к числовому. В качестве альтернативы, если единственное недостающее значение возникает из-за значений <1, вы можете просто установить для всех отсутствующих значений в числовых столбцах значение 1. Я был бы рад объяснить любой подход.

— 08.01.2019 16:18

Какие команды вы используете для импорта данных? Вам будет легче помочь, если вы включите простой воспроизводимый пример с образцом ввода и желаемым выводом, который можно использовать для тестирования и проверки возможных решений. Трудно помочь, если мы даже не знаем, какой код вы используете.

— 08.01.2019 16:18

Моя электронная таблица содержит 15 листов, каждый из которых состоит из 3-25 столбцов данных. Каждый столбец может содержать или не содержать знаки «<». Мне нужно удалить «<» и сохранить все # как числа, чтобы значения можно было изобразить.

— 08.01.2019 19:04

r special-characters

08.01.2019 16:15

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Ответы 1

читать столбец как символ / текст

образец данных (./test.xlsx)

код

df <- readxl::read_excel( "./test.xlsx", sheet = 1, col_types = c("text") )
df
# number
#   <chr> 
# 1 1     
# 2 2     
# 3 3     
# 4 <1    
# 5 3 

#post-processing
library( dplyr )
df %>% mutate( number = gsub("<", "", number ) %>% as.numeric )
# # A tibble: 5 x 1
#   number
#    <dbl>
# 1      1
# 2      2
# 3      3
# 4      1
# 5      3

Это решение дает мне половину пути, но в моей электронной таблице много столбцов. Есть ли общий способ указать R перейти в каждый столбец и заменить «<» без необходимости называть столбец по имени? У меня есть 15 листов, каждый из которых содержит столбцы с уникальными именами, поэтому я не могу каждый раз называть их кодом ...

— 08.01.2019 19:05

@SRO да, можно. но это другой вопрос (на который также был дан ответ, поэтому используйте поиск)

— 08.01.2019 19:07

08.01.2019 16:18