я планирую прогнозировать 2023
рабочие часы и дни для своих сотрудников, у каждого сотрудника есть
DaysCount
= количество отработанных дней, а также HoursWorked
= количество часов, которые он провел на работе. Вопрос, это возможно? Могу ли я предсказать статистику следующего года на основе этих двух значений?
Любые идеи ?
зачем предполагать, что ваши сотрудники остаются неизменными каждый год (они могут меняться или просто стареть, работать в разных ролях). в этих данных нет ничего постоянного, поэтому нет основы для прогноза.
хорошо, у меня есть эти значения за предыдущие четыре года, какую информацию я должен использовать, чтобы сделать такой прогноз?
Да, можно, но, возможно, это будет неточное решение. Но я постараюсь помочь вам найти решение.
Количество атрибутов: Прежде всего, модель машинного обучения требует хороших характеристик исторического человека, чтобы делать прогнозы об их будущем, использование только двух атрибутов может быть недостаточным для точных прогнозов.
Размер тренировки: еще один важный аспект - размер обучения, например, у вас есть длинная история для всех сотрудников? Например, есть ли у вас индивидуальные исторические данные для каждого сотрудника за последнее десятилетие?
Моделирование: Важный аспект, о котором вы должны подумать, касается моделирования. Как вы хотите обучать модель? Например, будете ли вы использовать историю сотрудников за январь, чтобы предсказать февраль? Или вы будете использовать историю сотрудников за 2021 год для прогнозирования 2022 года и использовать эту модель для прогнозирования 2023 года? Есть ли у вас какие-либо другие функции для питания модели? Чем объяснить количество отработанных дней и часов? Например, отработанные часы можно было бы объяснить днем недели, это означает, что, если вы работаете в ресторане (например), вы можете работать больше в выходные дни. Итак, важно, чтобы модель знала день недели. Количество дней может зависеть от отпуска/праздничных дней, поэтому включение этой информации в данные должно быть очень важным. После этого вы должны подумать, как вы будете разделять данные на обучающие и тестовые. Будете ли вы использовать историю последних семи дней, чтобы предсказать следующий день? Или вы будете использовать историю за последний месяц, чтобы предсказать следующий месяц?
Привет, я Data Scientist, могу я вам помочь? Посмотрите на меня в Linkedin: linkedin.com/in/italo-de-pontes-oliveira
эй, итало, у меня есть данные за предыдущие 4 года для каждого сотрудника, месяц работы равен 22 дням, и если возможно, я хочу использовать эти данные за 3 месяца 2022 года, чтобы предсказать следующий месяц.
Хм, я думаю, вам следует искать что-то вроде «временного скользящего окна», чтобы делать предсказания вперед. Это может помочь вам.
нет, почти нет другого способа, кроме как угадывать, если бы у вас были эти значения и для некоторых предыдущих лет, тогда вы могли бы смоделировать какой-то правдоподобный сценарий, потому что у вас было бы больше данных, теперь у вас есть в основном одна точка данных, которая может идти практически в любом направлении. . хорошо, может быть, вы можете сделать простую вещь, рассчитать среднее количество часов за рабочий день и сделать что-то с этим, но есть много факторов, которые влияют на это, в то время как у вас есть только одна точка данных.