Несогласованные теги между файлами XBRL из SEC (EDGAR)

Я анализирую все файлы XBRL из SEC через EDGAR, чтобы получить некоторые данные (в формате json на python).

У меня нет проблем с разбором этих файлов. Моя проблема заключается в структуре файлов XBRL, предоставленных SEC, я заметил, что некоторые компании используют одни теги, а другие нет. Некоторые будут использовать «Доходы», в то время как другие не будут иметь никаких тегов, относящихся к доходам, у меня та же проблема с «Краткосрочными займами»...

Есть ли список тегов XBRL от SEC, которые используются во всех компаниях?

Спасибо

Пожалуйста, не могли бы вы предоставить ссылки на отчеты, которые вы просматриваете? Например, в отчете нет тега "Доход"? Может быть, будет легче объяснить это в контексте некоторых конкретных примеров.

pdw 19.10.2022 11:49

интересно, удалось ли вам найти решение этой проблемы? похоже, нам нужно отображение таксономии cik.. и с датой начала/окончания для некоторых полей/тегов.

mike01010 20.11.2022 07:05
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
3
91
3
Перейти к ответу Данный вопрос помечен как решенный

Ответы 3

Действительно, файловые системы используют несовместимые теги. Это одна из основных проблем обработки данных XBRL при подаче заявок.

Существует список тегов для использования всеми компаниями в пространстве имен таксономии US GAAP, однако одного этого недостаточно для решения проблемы, поскольку (i) компании могут по-прежнему использовать разные теги в рамках этой таксономии, и (ii) компании могут создавать новые концепции в своем собственном пространстве имен, также известные как концепции расширения, и иногда делают это, даже когда концепция US GAAP была бы применима.

Но есть и хорошие новости: Чарльз Хоффман, CPA, решил эту проблему, предоставив фундаментальную таксономию бухгалтерских концепций вместе с сопоставлениями и правилами, чтобы сделать все документы совместимыми. Я рекомендую этот урок в качестве отправной точки.

Ответ принят как подходящий

Короткий ответ: «нет», нет списка необходимых тегов для финансовых отчетов, представляемых в SEC (кроме некоторых тегов метаданных «Информация о документе и организации»).

Это отражает характер лежащих в основе финансовых отчетов, которые регулируются стандартом бухгалтерского учета US GAAP («Общепринятые принципы бухгалтерского учета»), который не предписывает конкретные данные, которые должны сообщаться, и в результате система XBRL не обеспечивает соблюдения определенные необходимые теги.

В обоих приведенных вами примерах, где Revenue не помечен, мне кажется, что это плохой выбор тега. Я думаю, что лучшее, что вы можете сделать в этом случае, это сделать вывод, что если RevenueNotFromContractWithCustomer также не помечен, то Revenue == RevenueFromContractWithCustomerExcludingAssessedTax. Такие выводы могут быть основаны на отношениях в таксономии ОПБУ США. Например, см. определение выручки в таксономии US GAAP (и, в частности, вкладку «Взаимосвязи»).

Я бы не стал полагаться исключительно на какой-либо список тегов, который предоставляет SEC или кто-либо еще.

Я бы также проверил исходные данные на предмет фактически используемых тегов.

Я бы еще спросил:

Как создать список всех тегов, используемых во всех заявках SEC Edgar, для каждого «типа подачи» (10K, 10Q, форма 3, форма 4, общежитие 5, форма 13F и т. д.)?

Я добавлю к этому. Я настоятельно рекомендую JohnTheQuant на Youtube... он ссылается на блокнот Google Collab, который загружает все данные SEC и преобразует их в формат Apache Parquet. Сделав это, вы можете использовать DuckDB для выполнения SQL-запросов каждый год/квартал. Это работает очень хорошо для меня, включая перечисление всех уникальных тегов. Смотрите здесь видео: youtube.com/watch?v=NPiJd9CiiYM&t=876s

araisbec 04.01.2023 19:58

Другие вопросы по теме