Я конвертирую файлы Word в PDF или HTML для страниц предварительного просмотра в заданиях очереди сервера (запускаются в nodejs) и использую последнюю версию pandoc (3.2.1). Но я думаю, что позволять nodejs запускать команду оболочки небезопасно.
Это безопасно? Или есть другой лучший способ сделать это? (Но это дополнительный сервер обработки файлов и никаких разрешений на доступ к другим ресурсам, это будет безопасно, даже код небезопасен, LOL)
Это часть моего кода в задании очереди:
const fileKey='uploads/xxxx.docx';// the files are store in storage service's uploads dir
let filePath= this.downloadToLocalTmp(filePath)
let outputPath = tmpdir() + path.sep + (fileKey.substring(fileKey.lastIndexOf('/')));
filePath = filePath.replaceAll(' ', '');// by @joesv 's advice, keep safe `; rm -rf /` => ';rm-rf/'
outputPath = outputPath.replaceAll(' ', '');
try {
// using pandoc in next release (1.2.0)
if (isUsePandoc) {
// note: pandoc not support doc
Logger.warn('using pandoc converting');
const command = `pandoc --embed-resources -o ${outputPath} ${filePath}`;
Logger.debug(`exec command: '${command}'`);
const stdout = execSync(command, { timeout: timeout });
Logger.debug(`exec command stdout: ${stdout.toString()}`);
} else {
// note: libreoffice support both doc + docx
Logger.warn('using libreoffice converting');
await libreOfficeFileConverter.convertFile(filePath, tmpdir(), 'pdf');
}
Logger.debug('convertWordFile finished : ' + filePath);
return outputPath;
} catch (error) {
Logger.error('convertWordFile error : ' + error);
throw error;
}
// ... upload to storage service
Да, если вы не подтвердите, что в outputPath
или filePath
нет ничего вредоносного.
Фрагмента кода, которым вы поделились, недостаточно, чтобы дать однозначный ответ «да» или «нет».
Используя фрагмент, которым вы поделились, злоумышленник мог отправить любое значение переменных, включая что-то похожее на filePath = "/tmp/file.pdf; rm -rf /"
.
Это тоже не помогло бы. Вы можете установить IFS (внутренний разделитель полей) на что-то другое и при этом выполнять что-то в bash, или кто-то может сделать что-то еще. Я бы порекомендовал проверить ответ @tarleb внизу.
Вызов pandoc обычно означает, что он имеет доступ к файловой системе, которую иногда можно использовать с помощью специально созданных документов. См. раздел «примечание о безопасности» в руководстве pandoc.
Более безопасным методом будет запуск pandoc в качестве сервера (pandoc server
), поскольку это гарантирует, что pandoc не будет иметь доступа к файловой системе. Или используйте флаг --sandbox
, который даст вам аналогичные гарантии. В этом случае использование exec
подойдет.
Спасибо, я обновляю код, и в моем случае все эти файлы сохраняются в хранилище. Возможно, нет
rm -rf
. Но на самом деле это может быть проблемой, поэтому я добавляюfilePath = filePath.replaceAll(' ', '');
перед exec. Еще раз спасибо.