Я анализирую все файлы XBRL из SEC через EDGAR, чтобы получить некоторые данные (в формате json на python).
У меня нет проблем с разбором этих файлов. Моя проблема заключается в структуре файлов XBRL, предоставленных SEC, я заметил, что некоторые компании используют одни теги, а другие нет. Некоторые будут использовать «Доходы», в то время как другие не будут иметь никаких тегов, относящихся к доходам, у меня та же проблема с «Краткосрочными займами»...
Есть ли список тегов XBRL от SEC, которые используются во всех компаниях?
Спасибо
@pdw Например, sec.gov/ix?doc=/Archives/edgar/data/3453/000155837022002040/… У Matson есть «Доход от контракта с заказчиком без начисленного налога», но не «Доходы», как в других отчетах. И хотя ShortTermBorrowings можно найти в отчетах Мэтсона, их нет в этом sec.gov/ix?doc=/Archives/edgar/data/3197/000095017022003502/… от Ceco Environmental Corp.
интересно, удалось ли вам найти решение этой проблемы? похоже, нам нужно отображение таксономии cik.. и с датой начала/окончания для некоторых полей/тегов.
Действительно, файловые системы используют несовместимые теги. Это одна из основных проблем обработки данных XBRL при подаче заявок.
Существует список тегов для использования всеми компаниями в пространстве имен таксономии US GAAP, однако одного этого недостаточно для решения проблемы, поскольку (i) компании могут по-прежнему использовать разные теги в рамках этой таксономии, и (ii) компании могут создавать новые концепции в своем собственном пространстве имен, также известные как концепции расширения, и иногда делают это, даже когда концепция US GAAP была бы применима.
Но есть и хорошие новости: Чарльз Хоффман, CPA, решил эту проблему, предоставив фундаментальную таксономию бухгалтерских концепций вместе с сопоставлениями и правилами, чтобы сделать все документы совместимыми. Я рекомендую этот урок в качестве отправной точки.
Короткий ответ: «нет», нет списка необходимых тегов для финансовых отчетов, представляемых в SEC (кроме некоторых тегов метаданных «Информация о документе и организации»).
Это отражает характер лежащих в основе финансовых отчетов, которые регулируются стандартом бухгалтерского учета US GAAP («Общепринятые принципы бухгалтерского учета»), который не предписывает конкретные данные, которые должны сообщаться, и в результате система XBRL не обеспечивает соблюдения определенные необходимые теги.
В обоих приведенных вами примерах, где Revenue
не помечен, мне кажется, что это плохой выбор тега. Я думаю, что лучшее, что вы можете сделать в этом случае, это сделать вывод, что если RevenueNotFromContractWithCustomer
также не помечен, то Revenue
== RevenueFromContractWithCustomerExcludingAssessedTax
. Такие выводы могут быть основаны на отношениях в таксономии ОПБУ США. Например, см. определение выручки в таксономии US GAAP (и, в частности, вкладку «Взаимосвязи»).
Я бы не стал полагаться исключительно на какой-либо список тегов, который предоставляет SEC или кто-либо еще.
Я бы также проверил исходные данные на предмет фактически используемых тегов.
Я бы еще спросил:
Как создать список всех тегов, используемых во всех заявках SEC Edgar, для каждого «типа подачи» (10K, 10Q, форма 3, форма 4, общежитие 5, форма 13F и т. д.)?
Я добавлю к этому. Я настоятельно рекомендую JohnTheQuant на Youtube... он ссылается на блокнот Google Collab, который загружает все данные SEC и преобразует их в формат Apache Parquet. Сделав это, вы можете использовать DuckDB для выполнения SQL-запросов каждый год/квартал. Это работает очень хорошо для меня, включая перечисление всех уникальных тегов. Смотрите здесь видео: youtube.com/watch?v=NPiJd9CiiYM&t=876s
Пожалуйста, не могли бы вы предоставить ссылки на отчеты, которые вы просматриваете? Например, в отчете нет тега "Доход"? Может быть, будет легче объяснить это в контексте некоторых конкретных примеров.