Vogue (@voguemagazine) • Instagram photos and videos
Fashionista (@fashionista_com) • Instagram photos and videos
The Business of Fashion (@bof) • Instagram photos and videos
Я проанализировал строку внутри тега <title> на странице Instagram.
Мне нужно разобрать экранное имя, которое состоит из всех строк до (@....) в строке выше.
В моих примерах выше это будут Vogue, Fashionista и The Business of Fashion соответственно.
Я пробовал что-то вроде
string.split(' ')[0].replace('\n', ''), но это просто анализирует самый первый токен.






модуль "ре" поможет. Пожалуйста, найдите ниже образец, который делает это возможным:
import re
pattern = re.compile("(.+?) \(@.*?\)")
string = "Vogue (@voguemagazine) • Instagram photos and videos"
word = pattern.findall(string)[0]
В шаблоне "(.+?) \(@.*?\)"
(.+?) - ловит все символы перед пробелом («») и скобками;\(@.*?\) - улавливает
вещи в скобках (например, между "(\" и "\)"), например "@"
и все остальные символы (".*?")