Общий формат URL

Я пытаюсь решить эту проблему, извлекающую URL-адрес из большого текста, и я искал общий формат для URL-адреса, пока не нашел этот https://en.wikipedia.org/wiki/URL; и не сделал этот код, но я не знаю, почему он не нашел URL-адрес:

 Pattern p = Pattern.compile("(http|https|ftp|mailto|file|data|irc|rtsp)(\\:)(^\\w{1})([a-zA-Z0-9/%+.-]*$)\\.(com|net|org|jo)\/(.+)" , Pattern.CASE_INSENSITIVE);
        Matcher m = p.matcher(text);
       if (m.matches())
             System.out.println(text) ;
       else
             System.out.println("no matches");

Какой URL не найден? Приведите конкретный пример.

J Fabian Meier 23.05.2018 14:13

возьмите этот текст: «Я пытаюсь решить эту проблему, которая извлекает URL-адрес из большого текста, и я искал общий формат для URL-адреса, пока не нашел этот en.wikipedia.org/wiki/URL; и я делаю этот код, но я не знаю, почему он этого не сделал» не нашел URL: "

Mostafa Amer 23.05.2018 14:15

для извлечения URL-адреса wkipedia

Mostafa Amer 23.05.2018 14:15

для извлечения URL-адреса wkipedia

Mostafa Amer 23.05.2018 14:16

На что ваши доллары?

J Fabian Meier 23.05.2018 14:21

@ user8545027 вам нужна только часть URL-адреса?

Deathshadow 23.05.2018 14:25

Мне нужна часть URL из всего текста во втором комментарии

Mostafa Amer 23.05.2018 14:28

$ Для привязки конца строки

Mostafa Amer 23.05.2018 14:29
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами
Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами
В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...
Поднятие тревоги для долго выполняющихся методов в Spring Boot
Поднятие тревоги для долго выполняющихся методов в Spring Boot
Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...
Полный курс Java для разработчиков веб-сайтов и приложений
Полный курс Java для разработчиков веб-сайтов и приложений
Получите сертификат Java Web и Application Developer, используя наш курс.
1
8
56
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Для меня это Regex сработало:

(http|https|ftp|mailto|file|data|irc|rtsp)(\:)(//)([a-zA-Z0-9/%+.-/]*)\.(com|net|org|jo)/(\w*/)*(\w+)

Вам нужно будет захватить последнюю группу, если вы хотите, чтобы последняя часть URL-адреса здесь была группой 7.

Я надеюсь это помогло

это ответ, который я искал "(http | https | rtps | rtp): // [-A-Za-z0-9 + & @ # /%? = ~ _ () |!:,.;] * [-A-‌ Za-z0-9 + & @ # /% = ~ _ () |] ‌ "

Mostafa Amer 26.05.2018 21:37

Другие вопросы по теме