




XML :: FeedPP хорошо ...
Почти каждый раз, когда вы спрашиваете: «Как я могу сделать X в Perl?», Ответ - посмотреть на CPAN поиск, чтобы найти модуль, который это делает.
Чтобы загрузить из Интернета, вам может помочь семейство модулей LWP. Чтобы проанализировать документы, попробуйте что-нибудь с Кормить, RSS или Атом в имени.
Однако четыре года спустя я теперь рекомендую Mojolicious, который имеет собственный модуль пользовательского агента и очень сильную поддержку синтаксического анализа DOM и различных способов извлечения частей документа. В зависимости от того, что вы хотите, вам, вероятно, больше не понадобится специальный модуль подачи.
Брайан, в данном случае это не так полезно, как вы могли бы надеяться: поиск «RSS» и некоторых других терминов, как правило, дает вам писателей, плагины для других инструментов и старые, мертвые модули, и любой сигнал в них заглушается шум.
@ijw: потратьте на попытки более 3 минут.
Я хотел бы видеть сортировку по «популярности» или «загрузкам» в поиске CPAN (и PPM), например, в Nuget есть nuget.org/packages. Это неплохой прокси для того, «насколько хорош этот модуль?».
Попробуйте MetaCPAN для ++ на модулях. Однако это ничего не значит о качестве. :)
Существуют как XML :: RSS, так и XML :: Атом. Будьте осторожны - XML :: Atom, похоже, не поддерживается активно и, как сообщается, содержит ошибки. Но основ должно быть достаточно, чтобы вы начали.
LWP :: Simple - хороший выбор для получения фидов.
XML :: RSS в основном используется для создания файлов RSS, но он также имеет методы parse() для чтения RSS.
Я обнаружил, что XML :: Feed намного лучше справляется с ошибками, которые вы получите находятся, если попытаетесь проанализировать произвольные каналы, создание которых вы не контролируете.
Я использовал версию XML :: FeedPP для XML :: Feed с большим успехом.
Остерегайтесь хотя бы bugs.debian.org/cgi-bin/…, но это лучшее, что есть, AFAIK.