Мне нужно регулярное выражение, с помощью которого я мог бы найти, есть ли какие-либо назначения внутри условий.
Он должен быть максимально гибким, потому что я буду запускать его на многих файлах .php, чтобы найти такие ошибки:
<?php
if ($foo = "bar") { // instead of $foo == "bar"
//...
}
Я нашел вопрос, похожий на мой, который помог мне решить проблему с помощью этого регулярного выражения:
/if\s*\(.+[^!=<>]=[^=]/
Однако он также соответствует тому, где внутри строки есть знак '=', а это не то, что мне нужно:
<?php
if ($foo != '=') {
//...
}
Обратите внимание, что он также должен работать в сложных условиях со множеством сравнений, таких как:
if ($foo == 0 && ($bar == 1 || $fooBar = 1) { // Instead of $fooBar == 1
// ...
}
Найти это регулярное выражение довольно сложно, и я был бы очень благодарен, если бы мне помогли!
Спасибо @Ultimer, я никогда не думал, что PHP не станет обычным языком. Я узнаю, как использовать токенизаторы, если это лучшая альтернатива!
Я думаю, вы не найдете ни одного регулярного выражения, которое делало бы то, что вы хотите. Я бы предложил какой-то оператор grep for if, в котором в каждой выходной строке указывается имя файла, номер строки и текст строки. Затем удалите все == и '=' из результатов. (Замена их на __EQEQ__, __CHAR_EQ__ и т. д. может быть лучше, чтобы отличить действительные от потенциально недействительных.) Затем удалите все найденные строки без =. Вы можете увидеть другие распространенные действительные шаблоны, которые можно исключить. Остальные строки должны содержать выражения, которые вы хотите найти, а также другие допустимые выражения.






Вы можете попробовать ограничить набор символов, идентифицирующих имя переменной, чтобы не использовать ., который также включает знаки равенства:
if\s*\([$\w-]+\s*[^!=<>]=[^=]
Если в ваших условиях всегда есть переменная и если вы используете несколько условий, например if ($foo == "bar" && $tmp = 'tmp'), вы можете сократить регулярное выражение следующим образом:
[$\w-]+\s*[^!=<>]=[^=]
Это хорошее предложение, спасибо! Но это не работает со сложными условиями со множеством сравнений. Добавлю уточнения к своему вопросу. Могу ли я спросить, почему вы используете группу захвата для «=» и почему вы указываете, что есть только одна открывающая скобка \({1}? Кроме того, в чем польза квантификатора {1,1}?
На самом деле, я начал с регулярного выражения ответа на вопрос, который вы связали. Все три вещи, которые вы перечислили, лишние и их можно убрать. Можете ли вы добавить несколько примеров сложных условий, которые вы используете?
Вы можете использовать это
/if\s*\(\s*[^!=<>\n]*=[^=\n]*\)/
Пример
К вашему сведению: я не знаю, что вы пытаетесь заархивировать. Я предложил решение, основанное на вашем вопросе. (Регулярное выражение)
Он работает хорошо, но не работает с условиями, требующими более одного сравнения. Моя вина, мне следовало быть более точным. Должен ли я подробно рассказать, почему и как я буду это использовать? Я подумал, что будет проще сразу перейти к делу.
Первоначальная цель — просмотреть файлы PHP и найти назначения внутри условий.
Мой первый подход заключался в использовании регулярных выражений. Однако PHP не является обычным языком, поэтому нам не следует использовать с ним регулярные выражения. (Я не считаю, что демонстрация необходима, дайте мне знать, если она нужна)
Решение, которое я нашел, включает простой цикл с использованием токенизаторов . Поделюсь, вдруг кому-то будет полезно.
$path = 'path/to/file.php';
$content = file_get_contents($path);
$tokens = token_get_all($content);
$inCondition = false;
$parenthesis = 0;
foreach ($tokens as $token) {
if (is_array($token)) {
$token = $token[1];
}
switch ($token) {
case 'if':
$inCondition = true;
break;
case '(' :
if ($inCondition) {
$parenthesis++;
}
break;
case '=':
if ($inCondition && $parenthesis === 1) {
throw new Exception("Assignment in if condition !");
}
break;
case ')':
if ($inCondition) {
$parenthesis--;
if ($parenthesis === 0) {
$inCondition = false;
}
}
break;
}
}
Я считаю, что этот пример кода можно было бы улучшить, но он работает очень хорошо!
Я не думаю, что регулярное выражение достаточно сложно, чтобы понять конструкции, используемые PHP. По той же причине, по которой не следует анализировать (X)HTML с помощью регулярных выражений , я считаю, что то же самое относится и к PHP. Конечно, вы можете использовать регулярное выражение небольшими частями как часть синтаксического анализатора, который выполняет такие операции, как очистка, токенизация и т. д. В PHP я бы использовал токенизатор. См. php.net/manual/en/tokenizer.examples.php