Количество слов в питоне

Я хочу подсчитать количество слов в тексте, взятом с сайта. Я пытаюсь использовать следующий код ниже:

import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen

def get_text(url):
  page = urlopen(url)
  soup = BeautifulSoup(page, "lxml")
  text = ' '.join(map(lambda p: p.text, soup.find_all('p')))
  return soup.title.text, text

number_of_words = 0

url = input('Enter URL - ')
text = get_text(url)

Я хочу рассчитать количество слов для этой текстовой переменной

Принимая https://www.ibm.com/in-en/cloud/learn/what-is-artificial-intelligence в качестве URL-адреса, все работает хорошо, за исключением получения количества слов текстовой переменной.

P.S. - Переменная подсчета word_count введена в качестве параметра, и количество слов в сгенерированной сводке отличается.

Также мне удалось получить длину текстового символа исходного текста, полученного из URL-адреса, используя следующий код

print('Text character length - ', len(str(text)))

Что вы пытались сгенерировать количество слов? Каков ожидаемый результат, каков ваш результат?

cafce25 18.11.2022 16:57
14 Задание: Типы данных и структуры данных Python для DevOps
14 Задание: Типы данных и структуры данных Python для DevOps
проверить тип данных используемой переменной, мы можем просто написать: your_variable=100
Python PyPDF2 - запись метаданных PDF
Python PyPDF2 - запись метаданных PDF
Python скрипт, который будет записывать метаданные в PDF файл, для этого мы будем использовать PDF ридер из библиотеки PyPDF2 . PyPDF2 - это...
Переменные, типы данных и операторы в Python
Переменные, типы данных и операторы в Python
В Python переменные используются как место для хранения значений. Пример переменной формы:
Почему Python - идеальный выбор для проекта AI и ML
Почему Python - идеальный выбор для проекта AI и ML
Блог, которым поделился Harikrishna Kundariya в нашем сообществе Developer Nation Community.
Как автоматически добавлять котировки в заголовки запросов с помощью PyCharm
Как автоматически добавлять котировки в заголовки запросов с помощью PyCharm
Как автоматически добавлять котировки в заголовки запросов с помощью PyCharm
Анализ продукта магазина на Tokopedia
Анализ продукта магазина на Tokopedia
Tokopedia - это место, где продавцы могут продавать свои товары. Товар должен быть размещен на витрине, чтобы покупателям было легче найти товар...
2
1
78
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

len(str(text)) будет считать буквы, а не слова, чтобы подсчитать общее количество слов, вам придется разделить текст len(str(text).split()):

import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen


def get_text(url):
    page = urlopen(url)
    soup = BeautifulSoup(page, "lxml")
    text = ' '.join(map(lambda p: p.text, soup.find_all('p')))
    return soup.title.text, text


url = input('Enter URL - ')

text = get_text(url)
number_of_words = len(str(text).split())
print(number_of_words)

вывод:

1080

Другие вопросы по теме