Возможно ли объединить два файла .csv с точностью до часа?

У меня есть два файла .csv с именами «tag.csv» и «wind.csv», которые я хотел бы объединить на основе столбца «Дата». Однако, как вы можете видеть из данных ниже, времена не совпадают в точности.

tag.csv

Date
13/12/2014 05:11
13/12/2014 05:43
13/12/2014 06:34

wind.csv

Date
13/12/2014 05:00
13/12/2014 06:00
13/12/2014 07:00

Я использую следующий простой сценарий.

tag<- read.csv("tag.csv")
wind<- read.csv("wind.csv")
myfulldata = merge(tag, wind)

Есть ли команда, которую я мог бы добавить, чтобы данные слились с ближайшим временем? Например, 13.12.2014 05:11 объединится с 13.12.2014 05:00

Возможно, показ вашего ожидаемого результата прояснит этот вопрос.

— 08.01.2019 16:54

Здесь есть самые разные вопросы. Можете ли вы гарантировать матч 1: 1? Если нет, хотите ли вы, чтобы tag соответствовал ближайшему wind или wind соответствовал ближайшему тегу? Было бы достаточно просто округлить время до ближайшего часа, а затем объединить? Поскольку ваши образцы данных не содержат никакой другой информации, трудно определить, что с чем объединено - в лучшем примере было бы еще 1 столбец для каждого ввода, а затем отображать ожидаемый результат.

— 08.01.2019 16:59

Я бы хотел, чтобы ветер соответствовал метке, но я думаю, что ваше предложение округления до ближайшего часа будет самым быстрым способом решения проблемы. Спасибо.

— 08.01.2019 17:28

r merge temporal-database

08.01.2019 15:08

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Пакет data.table имеет свой собственный метод слияния и опцию roll, которая позволяет наиболее близкие совпадения. например

library(data.table)
dt1 <- data.table(a = c(1,2,3,4), b=1:4)
dt2 <- data.table(a = c(1.6,2.1,3.2,4.9), c=1:4)
setkeyv(dt1, "a")
setkeyv(dt2, "a")
dt1[dt2, roll = "nearest"]

См. Другой пример в Присоединитесь к R data.tables, где ключевые значения не совсем равны - объедините строки с ближайшим временем.

Однако, чтобы быть надежным, я, вероятно, вместо этого сделал бы некоторые манипуляции с datetime, чтобы заставить их оба быть с точностью до ближайшего часа, а затем выполнить ближайшее соединение, если все остальное не удается.

изменить: этот метод не будет работать с объектами data.frame, если вы не использовали data.table раньше, возможно, оставайтесь простыми и круглыми часами

08.01.2019 17:32

Другие вопросы по теме

Слияние без перезаписи одной таблицы

Как я могу объединить 2 фрейма данных на основе списка кортежей, где каждый кортеж содержит соответствующий ключ от каждого фрейма данных?

Как заменить ветку в Git другой веткой без слияния

Как объединить несколько файлов xlsb в один

Проблема слияния нескольких файлов csv в один фрейм данных в R

Python Pandas объединяет и обновляет фрейм данных

Объединить значения определенного столбца фрейма данных в одну строку или единицу

Выборочное построение нового фрейма данных с существующими фреймами данных в дополнение к расчету

Сложное слияние с датами в r - разверните строки из одного df, чтобы они соответствовали другому

Как объединить другие строки фрейма данных с текущей строкой с помощью Python / Pandas

Возможно ли объединить два файла .csv с точностью до часа?

Ответы 1

Другие вопросы по теме

Похожие вопросы