Статистические значения Флейса Каппы с использованием statsmodels.stats.inter_rater

Я использую statsmodels.stats.inter_rater.fleiss_kappa для расчета надежности между оценщиками. Я получаю только значение каппы. Что делать, если мне нужны значения z, p и диапазон?

python pandas statsmodels

14.04.2024 15:31

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

155

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Мой совет вам — снова откройте конспекты лекций по статистике и посмотрите на формулы. Это стандартное упражнение, которое я часто даю своим ученикам:

import numpy as np
import pandas as pd
from statsmodels.stats.inter_rater import fleiss_kappa
from scipy.stats import norm

np.random.seed(42)

data = {
    f'Item{i+1}': np.random.choice([0, 1, 2], size=30, p=[0.33, 0.33, 0.34]) for i in range(15)
}
df = pd.DataFrame(data)

formatted_data = {
    f"Category {cat}": [(df[item] == cat).sum() for item in df] for cat in range(3)
}
formatted_df = pd.DataFrame(formatted_data)

kappa = fleiss_kappa(formatted_df.values)

category_totals = formatted_df.sum(axis=1) 
p = np.sum((category_totals / (30 * 15))**2)  

n = 15  
k = 3   
N = n * 30  

variance = (1 / (N * (n - 1))) * (N * p * (1 - p) + (n * (k - 1) * (p - (1 / k)**2)))
if variance > 0:
    z_value = kappa / np.sqrt(variance)
    p_value = 2 * (1 - norm.cdf(np.abs(z_value)))
    z_critical = norm.ppf(0.975)
    margin_of_error = z_critical * np.sqrt(variance)
    lower_bound = kappa - margin_of_error
    upper_bound = kappa + margin_of_error

    print("Fleiss' kappa:", kappa)
    print("Z-value:", z_value)
    print("P-value:", p_value)
    print("Confidence interval (95%):", (lower_bound, upper_bound))
else:
    print("Variance calculation error: Non-positive variance", variance)

который дает

Fleiss' kappa: -0.008536683290635389
Z-value: -0.1312124600755962
P-value: 0.8956072394628303
Confidence interval (95%): (-0.13605194965657783, 0.11897858307530704)

14.04.2024 16:05

Другие вопросы по теме

Добавить столбец в зависимости от словаря

Объедините два фрейма данных с масштабируемыми столбцами, разместив второй фрейм данных непосредственно под первым фреймом данных, не удаляя ключи

Pandas – Как извлечь значение в текущую строку на основе предыдущей строки

Более быстрый способ конвертировать результаты DuckDB в фрейм данных, который поддерживается потоком?

Зарегистрируйте фрейм данных Pandas в машинном обучении Azure: NOT_SUPPORTED_API_USE_ATTEMPT

Мин из столбцов из dict

Живой хвост CSV с FTP-сервера

Проверьте, использует ли этот код скользящее окно данных

Могу ли я выбрать столбцы в фрейме данных с помощью цикла for?

Как разбить массив, используя его минимальную запись

Статистические значения Флейса Каппы с использованием statsmodels.stats.inter_rater

Ответы 1

Другие вопросы по теме

Похожие вопросы