Найдите диапазон и количество позиций с нулем

У меня есть два файла excel

И,

Найдите диапазон и количество позиций с нулем

Я хочу знать диапазон и позиции с 0 значениями покрытия и вывод следующим образом:

Найдите диапазон и количество позиций с нулем

Где,

size = (end - start)+1

mapped = positions with > 0 Coverage

%mapped = (mapped/size)*100

Completeness = (Total mapped/Total Size)*100

например, для вышеуказанного вывода Полнота = ((3 + 2) / (7 + 5)) * 100 = 41,66%

У меня есть несколько таких входных файлов для анализа. Как я могу это сделать в R?

stackoverflow.com/help/mcve

— 10.12.2018 20:11

ваш вопрос очень общий и бесполезный. 1) используйте данные примера, а не изображения. 2) Взгляните на отличную документацию о том, как фильтровать данные в R. В Интернете есть масса об этом, и это, безусловно, должно вам помочь.

— 10.12.2018 20:12

10.12.2018 20:01

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Ответы 1

Чтобы узнать, какая часть data.frame удовлетворяет какому-либо условию, вы можете использовать which, он предоставит вам все индексы, для которых это условие - TRUE, так что вы можете использовать это для получения интересующих вас частей.

Если мы предположим, что у вас есть data.frame с именем df1 для первой части вашего вопроса, а второе изображение называется df2, тогда вы можете получить диапазон индекса строк в df1 с помощью 'chr1' следующим образом:
range <- which(df1$chr=='chr1')[df2$start[1]]:which(df1$chr=='chr1')[df2$end[1]]
или вместо того, чтобы вручную вводить chr1, вы можете использовать df2$chr[1].
Для подсчета sum(df1[range, 'coverage'] > 0) сообщает вам, сколько значений больше нуля.

Теперь нам нужно сделать это для всех строк вместе, мы можем использовать sapply, чтобы что-то сделать для всех предоставленных значений:

df2$mapped <- sapply(1:nrow(df2), function(row) {
    range <- which(df1$chr==df2$chr[row])[df2$start[row]]:which(df1$chr==df2$chr[row])[df2$end[row]]
    sum(df1[range, 'coverage'] > 0)
}

На другие ваши вопросы легче ответить, чем их задать, так как в R большинство функций векторизованы: вы можете делать что-то для нескольких значений одновременно.

df2$size = (df2$end - df2$start)+1
df2$perc_mapped = (df2$mapped/df2$size)*100

Полнота - это всего лишь сумма всех строк вместе, sum(df2$size) и sum(df2$mapped)

10.12.2018 20:29

Другие вопросы по теме

R: Цикл через каждые 5 строк кадра данных и вычисление инкрементного значения

Слияние в R не соответствует последней строке

Как мне получить соответствующее значение ячейки результата в R

Как построить несколько UMAP в указанной сетке, например, 6 x 3?

Функция экспорта не поддерживает загрузку .svg

Выберите значения на основе других столбцов

Проблема распространения R: после добавления новых обновленных данных spread () создает фрейм данных водопада

ReadLines убивает R в purrr :: map

Полиномиальная пробит-регрессия с независимыми переменными смешанного типа

Как я могу создать переменную в наборе данных, содержащую вектор всех чисел между двумя другими переменными?

Найдите диапазон и количество позиций с нулем

Ответы 1

Другие вопросы по теме

Похожие вопросы