Я пытаюсь сделать небольшой анализ тем электронных писем, которые я получаю. У меня есть электронные письма в Google-листе в формате ниже. Я пытаюсь подсчитать, как часто упоминается «приватность» или «конфиденциальность». Моя проблема заключается в том, что почти в каждой подписи электронной почты упоминается одно из этих слов, поэтому, когда я использую ПОИСК, каждая ячейка возвращает ИСТИНА.
Большинство подписей электронной почты начинаются с похожих фраз, поэтому я попытался удалить все после этих фраз с помощью этой формулы:
=ArrayFormula(TRIM(LEFT(B1:B,MIN(IFERROR(FIND({" This email and any","IMPORTANT NOTICE", " Important notice","The information in this email"," The contents of this message"," Information in this email including"," This electronic mail message"," this message and any attachments"," This message is intended for the addressee only"," This email is CONFIDENTIAL"},B1:B),LEN(L2))))))
Столбец B — это столбец с основным текстом электронного письма.
Однако это, похоже, удаление текста, который следует за словами, которых нет в моем поиске (например, удаление всего после «не» вместо «ВАЖНОЕ ЗАМЕЧАНИЕ»).
Может кто что посоветует:
Пример таблицы: |название письма|тело письма| |-----------|----------| |Хочешь купить мои вещи| Здравствуйте, я хотел бы знать, не хотите ли вы купить эту вещь, которую я хочу вам продать. ВАЖНО: это электронное письмо является личным | |два по цене одного| У меня есть отличное предложение для вас! Это электронное письмо и вложения являются частными и конфиденциальными | |Последний шанс купить вещи!| Можем ли мы поговорить наедине о том, не хотите ли вы купить мои вещи?|
В приведенном выше примере я хочу подсчитать строку 3, но не строки 1 и 2, поскольку упоминания «личного» и «конфиденциального» в 1 и 2 находятся в подписи.
Спасибо!
поделиться копией таблицы
Боюсь, я не могу. Это рабочая электронная почта, так что меня уволят.
Кажется, я понимаю, что ошибка, которую вы описали, возникает с вашей формулой. Как только формула найдет одно из значений, которые вы используете для идентификации подписи электронной почты, например «Важное уведомление», и вернет расположение этого текста, скажем, позицию 96, она затем использует 96 для всех ячеек, например это: LEFT(B1:B,96)
. Таким образом, вы, возможно, не сможете выполнить составную формулу массива формулы массива, которую вы пытаетесь.
Использование такой формулы в B2 и перетаскивание ее вниз должно работать:
=ArrayFormula(TRIM(LEFT(B2,MIN(IFERROR(
FIND({" This email and any","IMPORTANT NOTICE", " Important notice","The information in this email"," The contents of this message"," Information in this email including"," This electronic mail message"," this message and any attachments"," This message is intended for the addressee only"," This email is CONFIDENTIAL"},B2),
LEN(L2))))))
Примечание. Я не уверен, какое значение находится в вашем L2.
Но для общего подхода это действительно зависит от того, насколько хорошо работают ваши термины для идентификации подписей электронной почты, чтобы исключить их из ваших окончательных полнотекстовых поисков.
Спасибо, это действительно помогает.
Чтобы другим было проще помочь вам, предоставьте образец листа с несколькими образцами электронных писем и результатами, которые вы ожидаете от этих данных. Ваши примеры в вашем вопросе не ясны. Вот руководство по публикации: support.google.com/docs/thread/3808684?hl=ru