Прямо сейчас я использую mediawiki api и модуль запросов, чтобы попытаться извлечь определенную информацию из своего рода таблицы со страницы википедии. В качестве примера мы будем использовать песню Zombie, где справа есть «таблица», где указаны альбом, автор, дата выпуска и так далее. Единственная проблема, с которой я сталкиваюсь, заключается в том, что я не знаю, как запрашивать эти данные, поскольку я использую эту ссылку в качестве конечной точки: https://en.wikipedia.org/w/api.php?format=json&formatversion=2&action=query&titles=Zombie_(song)&prop=extracts чтобы попытаться найти то, что мне нужно, но на странице появится текст. Я попробовал песочницу, и у меня возникли проблемы с поиском того, что могло бы дать мне нужную информацию. Я ценю любые советы и предложения, спасибо.
Для такого рода метаданных лучше всего использовать Викиданные. На боковой панели Википедии есть ссылка на элемент Wikidata, и вы можете использовать запрос API, такой как https://www.wikidata.org/w/api.php?action=wbgetclaims&entity=Q169298, для получения данных в структурированном виде. Для получения информации о том, что означают эти результаты, см. Документы Wikibase API.
[Редактировать:] Чтобы получить идентификатор объекта, вы можете использовать wbgetentities
с заголовком Википедии (titles
) и идентификатором вики (sites
); например: https://www.wikidata.org/w/api.php?action=wbgetentities&sites=enwiki&titles=Zombie_(song)
Как получить сущность страниц, которые я хочу запросить?
Итак, как я могу прочитать это для получения информации из информационного окна?
Ознакомьтесь с вопросом, на который ссылается @Tgr выше, у него есть дополнительная информация.
См. stackoverflow.com/questions/33862336/…