Например, используя Java, когда я ищу с доменным именем «trendyol.com», могу ли я найти письма, связанные с доменом, на разных сайтах?
http://olaybende.com/acayip/trendyol-corona-virusu-kaynakli-fahis-fiyatlarla-ilgili-aciklama-yapti 5 марта 2022 г.
http://digitalage.com.tr/trendyoldan-koronavirusle-beraber-artan-fiyatlara-iliskin-aciklama 25 февраля 2022 г.
http://sancaktepenews.com/ihtiyac-belirlendi-stoklar-hazirlandi 20 февраля 2022 г.
http://borsametre.com.tr/trendyoldan-koronavirusle-ilgili-haksiz-fiyat-olusumlarina-yonelik-tedbir-aciklamasi/1191 26 января 2022 г.
http://agriajans.com.tr/ihtiyac-belirlendi-stoklar-hazirlandi-9176.html/ekonomi/47/44/11/13/03/2020/admin 22 ноября 2021 г.
http://agriajans.com.tr/insaf-izan-kalmadi-kendimizi-vuruyoruz-9167.html/ekonomi/43/44/11/13/03/2020/admin 22 ноября 2021 г.
http://haberlerwebte.com/trendyol-15-tllik-makarnalar-icin-aciklama-yapti-4607h.htm 15 ноября 2021 г.
http://teknosafari.net/trendyol-fiyat-artisi-olan-urunlerle-ilgili-islem-yaptigini-acikladi 27 октября 2021 г.
http://paraajansi.com.tr/trendyol-haksiz-fiyat-olusumuna-karsi-539-urune-islem-yapti/2531 7 августа 2020 г. УДАЛЕНО
http://paraajansi.com.tr/trendyoldan-koronavirusle-ilgili-haksiz-fiyat-olusumlarina-yonelik-tedbir-aciklamasi/2291 7 августа 2020 г. УДАЛЕНО
Могу ли я выводить так? Как я могу показать удаленные записи?
Я решил свою проблему. Вы можете узнать, на каких сайтах используется домен. Вы можете пропустить сайты, которые вам не нужны. Добавив базу данных, вы можете удалить ее при следующем поиске.
public class FinderDomain {
public static final String GOOGLE_SEARCH_URL = "https://www.google.com/search";
private static String Argent = "Mozilla/5.0";
public static void main(String[] args) throws IOException {
String searchTerm = "trendyol.com";
int num = 60; //How many pages do you want
String searchURL = GOOGLE_SEARCH_URL + "?q='" + searchTerm + "'&num = " + num;
Document doc = Jsoup.connect(searchURL).userAgent(Argent).get();
Elements results = doc.select("a");
for (Element result : results) {
String linkHref = result.attr("href");
if (linkHref.startsWith("http")) {
if (!continueValue(linkHref, searchTerm)) {
System.out.println(linkHref);
}
}
}
public static boolean continueValue(String s, String searchTerm) {
return s.contains(searchTerm) || s.contains("google.com") || s.contains("facebook.com") || s.contains("instagram.com") || s.contains("twitter.com") || s.contains("linkedin.com") || s.contains("youtube.com") || s.contains("webcache") || s.contains("pinterest.com")
|| s.contains("pinterest.com") || s.contains("translate.google.com") || s.contains("policies.google.com")
|| s.contains("apkpure.com") || s.contains("www.glassdoor.com") || s.contains("support.google");
}
}
Может быть, вы можете использовать Google или написать свой собственный парсер для поиска веб-страниц, содержащих такую информацию. Для удаленных записей: вы можете распознать их только постфактум: вы нашли такую информацию, но при более позднем сканировании ее уже нет.