Я пытаюсь очистить данные из Википедии. У меня есть поле данных, содержащее размеры, как показано ниже.
["112 x 76 yards (102.4m x 69.4m)", "104.5 x 70.3 m", "107m x 72m",
"109×73 yds / 100×67 m", "{{convert|105|x|68|m|yd|1}}", "100 metres by 70 metres"]
Извлечь размеры достаточно просто, но извлечь единицу измерения довольно сложно, учитывая, сколько существует вариаций записей. Как лучше всего подойти к этому?
Я начал с использования;
"(\d+\.?\d*)"
Что должно извлечь все размеры, тогда я собирался сохранить только первые 2 числовых совпадения, сохранить первое совпадение единицы ('м', 'метр', 'метры', 'y', 'ярд', 'ярды ',' yd ',' ft '.....), а потом я смогу преобразовать все в метры.
Я просто не уверен, как бы я сохранил первый матч юнита.
возможно, полезный или связанный Регулярное выражение, извлекающее числовое измерение






Вы можете предоставить массив строк единиц измерения, которые вы хотите сопоставить и сопоставить с ним, а затем хешировать по индексу с размерами.