Google отказался от старого формата URL-адреса RSS-канала 1 декабря 2017 г. (уведомление об отказе от поддержки), в дополнение к этому они убрали кнопку в интерфейсе новостей Google для создания URL-адреса RSS (новости, в которых упоминается это изменение).
Это означает, что не существует общедоступного или задокументированного метода создания новой RSS-ссылки. Единственный документация, который у них есть, устарел, так как они изменили интерфейс.
Какой новый формат для создания RSS-канала для темы новостей Google?
Ссылки, которые Google предоставляет в RSS-ленте новостей, теперь подвергаются цензуре.





Обнаружена современная библиотека (1), в которой используется RSS новостей Google.
Новый формат URL выглядит следующим образом:
Главные новости:
https://news.google.com/news/rss
По основной теме:
https://news.google.com/news/rss/headlines/section/topic/{topic}
Где {тема} - одно из следующих значений: WORLD NATION BUSINESS TECHNOLOGY ENTERTAINMENT SPORTS SCIENCE HEALTH
По любой / произвольной теме:
Оказавшись на https://news.google.com, перейдите к нужной теме, например, это. Определите идентификатор темы в ее URL-адресе, например CAAqIQgKIhtDQkFTRGdvSUwyMHZNR056T1hFU0FtVnVLQUFQAQ и используйте формат:
https://news.google.com/rss/topics/{id}?hl = {lang}
В приведенном выше формате, по существу, rss/ добавляется после https://news.google.com/.
По геолокации:
https://news.google.com/news/rss/headlines/section/geo/{location}
Не уверен в форматировании параметра {location}
По поисковому запросу:
New link: https://news.google.com/rss/search?q = {query}
Old link: https://news.google.com/news/rss/search/section/q/{query}
Где параметр {query} - это поиск по произвольному тексту
Указание страны и языка:
Например, если вы хотите получать новости на шведском языке из шведских источников, добавьте следующую строку запроса к URL-адресу, чтобы изменить страну и язык на sv-SE:
?hl=sv&gl=SE&ceid=SE%3Asv
любой REST API, если вы его знаете?
@NeelamPursnani Боюсь, что я не знаю ни одного REST-API. Только нашел это, покопавшись в чужом исходном коде.
Это здорово, теперь я могу читать новости Google без рекламы! Для иврита я использую: news.google.com/news/rss/?hl=he&gl=IL&ceid=IL%3Ahe
Геолокация, кажется, поддерживает некоторую строку местоположения произвольной формы. Например. https://news.google.com/news/rss/headlines/section/geo/SanFrancisco и https://news.google.com/news/rss/headlines/section/geo/California работают.
Проект, на который вы ссылаетесь, принадлежит мне. Если я правильно помню, я вычислил форматы URL-адресов простым угадыванием. Однако Google тем временем отказался от метода геолокации, и он перестал работать. Я не уверен, есть ли замена. Также мне подходит вариант "Старая ссылка" для поискового запроса.
Для указания фразы в поисковом запросе, например "глобальное потепление", я определяю его как global% 20warming, используя% 20 в качестве разделителя.
можешь вытащить изображение? Я только что увидел, что в rss нет тега изображения :(
Кто-нибудь знает, как отсортировать результаты rss по дате? Есть ли атрибут, который я могу добавить к URL-адресу, чтобы это произошло? Спасибо всем.
Если RSS не дает результата, попробуйте добавить hl = {lang} в параметры URL.
Этот вариант больше не действует: https://news.google.com/news/rss/headlines/section/topic/ {тема} выдает ошибку 500.
Кажется, это работает: https://news.google.com/news?cf=all&hl=en&pz=1&ned=us&q=astronomy&output=rss
Упомянутая выше геолокация тоже работает. Вы также можете указать город и штат: https://news.google.com/news/rss/headlines/section/geo/DenverCo
Я исследовал схемы URL-адресов при написании код, связанный с другим ответом. Хотя кое-что за это время изменилось, похоже, что в настоящее время ваш ответ неверен: темы отлично работают с данной схемой. Однако геолокация нарушена. Я также думаю, что темы и поисковые запросы не дают одинаковых результатов, поэтому вы неверно приравниваете и то, и другое.
Допустимо, если тему писать ЗАГЛАВНЫМИ буквами :)
Обновленная лента новостей Google RSS
Вы можете попробовать и это.
https://news.google.com/rss?hl=en-NG&gl=NG&ceid=NG:en
где вы нашли документацию по таким параметрам, как hl g и т. д.
Я вообще никакой документации не использовал. Я просто ввожу этот URL в свой браузер https://news.google.com/news/rss. Результатом является указанный выше URL-адрес. Я думаю, его просто переформатировали. @ PirateApp
Запросы к конечной точке Geo, похоже, снова работают.
например https://news.google.com/news/rss/headlines/section/geo/{place_name}
Кроме того, если вы используете поиск без географии, вы можете указать 7-дневное окно, добавив +when:7d в свой поиск.
например https://news.google.com/rss/search?q = {key_words}+when:7d
Я тоже искал документацию. Это лучшая статья, которую я нашел.
https://blog.newscatcherapi.com/google-news-rss/
При использовании поиска вы также можете указать, чтобы статьи с определенным ключевым словом не включались.
например если я хочу найти страницы, содержащие слово «яблоко» без слова «пирог», вы можете указать
q=apple%20-pie
или полностью
https://news.google.com/rss/search?q=apple%20-pie&hl=en-GB&gl=UK&ceid=GB:en
Что ж, похоже, сегодня они полностью сломали старые каналы. Теперь все они предоставляют файлы, в которых тег
<generator>NFE/5.0</generator>противоположен тегу<generator>NFE/1.0</generator>. Очень раздражает, так как они бывают другого формата.