Pandas: Могу ли я предсказать, сколько часов мои сотрудники будут работать в следующем году, исходя из того, сколько дней и часов они отработали в этом году?

я планирую прогнозировать 2023 рабочие часы и дни для своих сотрудников, у каждого сотрудника есть DaysCount= количество отработанных дней, а также HoursWorked= количество часов, которые он провел на работе. Вопрос, это возможно? Могу ли я предсказать статистику следующего года на основе этих двух значений? Любые идеи ?

нет, почти нет другого способа, кроме как угадывать, если бы у вас были эти значения и для некоторых предыдущих лет, тогда вы могли бы смоделировать какой-то правдоподобный сценарий, потому что у вас было бы больше данных, теперь у вас есть в основном одна точка данных, которая может идти практически в любом направлении. . хорошо, может быть, вы можете сделать простую вещь, рассчитать среднее количество часов за рабочий день и сделать что-то с этим, но есть много факторов, которые влияют на это, в то время как у вас есть только одна точка данных.

Matiiss 17.03.2022 11:12

зачем предполагать, что ваши сотрудники остаются неизменными каждый год (они могут меняться или просто стареть, работать в разных ролях). в этих данных нет ничего постоянного, поэтому нет основы для прогноза.

njari 17.03.2022 11:18

хорошо, у меня есть эти значения за предыдущие четыре года, какую информацию я должен использовать, чтобы сделать такой прогноз?

Smordy 17.03.2022 13:23
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
3
45
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Да, можно, но, возможно, это будет неточное решение. Но я постараюсь помочь вам найти решение.

  • Количество атрибутов: Прежде всего, модель машинного обучения требует хороших характеристик исторического человека, чтобы делать прогнозы об их будущем, использование только двух атрибутов может быть недостаточным для точных прогнозов.

  • Размер тренировки: еще один важный аспект - размер обучения, например, у вас есть длинная история для всех сотрудников? Например, есть ли у вас индивидуальные исторические данные для каждого сотрудника за последнее десятилетие?

  • Моделирование: Важный аспект, о котором вы должны подумать, касается моделирования. Как вы хотите обучать модель? Например, будете ли вы использовать историю сотрудников за январь, чтобы предсказать февраль? Или вы будете использовать историю сотрудников за 2021 год для прогнозирования 2022 года и использовать эту модель для прогнозирования 2023 года? Есть ли у вас какие-либо другие функции для питания модели? Чем объяснить количество отработанных дней и часов? Например, отработанные часы можно было бы объяснить днем ​​недели, это означает, что, если вы работаете в ресторане (например), вы можете работать больше в выходные дни. Итак, важно, чтобы модель знала день недели. Количество дней может зависеть от отпуска/праздничных дней, поэтому включение этой информации в данные должно быть очень важным. После этого вы должны подумать, как вы будете разделять данные на обучающие и тестовые. Будете ли вы использовать историю последних семи дней, чтобы предсказать следующий день? Или вы будете использовать историю за последний месяц, чтобы предсказать следующий месяц?

Привет, я Data Scientist, могу я вам помочь? Посмотрите на меня в Linkedin: linkedin.com/in/italo-de-pontes-oliveira

Ítalo De Pontes Oliveira 17.03.2022 14:33

эй, итало, у меня есть данные за предыдущие 4 года для каждого сотрудника, месяц работы равен 22 дням, и если возможно, я хочу использовать эти данные за 3 месяца 2022 года, чтобы предсказать следующий месяц.

Smordy 18.03.2022 11:19

Хм, я думаю, вам следует искать что-то вроде «временного скользящего окна», чтобы делать предсказания вперед. Это может помочь вам.

Ítalo De Pontes Oliveira 18.03.2022 12:52

Другие вопросы по теме