Я создал приложение flask с nginx, работающим в контейнере докеров, и база данных postgresql в другом контейнере
Я создал около 10 страниц, на каждой странице звонят максимум 3 или 4, и ответ приходит нормально, и страница показывает результаты.
Но на одной из страниц я вызывал 7 API, чтобы получить данные из колбы: в каждом API выполняется несколько запросов к базе данных postgresql.
Все 7 API работают без проблем — проверено, ошибок не возникнет ни в запросах, ни в логике.
Что происходит: когда я открываю эту конкретную страницу, первые 5 API получают ответ без каких-либо проблем, последние 2 API не получают ответа и получают ошибку «504 Gateway Time-out».
при проверке логов вылезла вот такая ошибка:
Traceback (most recent call last):
File "./database_functions.py", line 7097, in get_status1
results = session.query(Customer.id).filter(Customer.category_id==category_id).all()
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/orm/query.py", line 3178, in all
return list(self)
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/orm/query.py", line 3334, in __iter__
return self._execute_and_instances(context)
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/orm/query.py", line 3359, in _execute_and_instances
result = conn.execute(querycontext.statement, self._params)
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/engine/base.py", line 988, in execute
return meth(self, multiparams, params)
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/sql/elements.py", line 287, in _execute_on_connection
return connection._execute_clauseelement(self, multiparams, params)
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/engine/base.py", line 1107, in _execute_clauseelement
distilled_params,
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/engine/base.py", line 1253, in _execute_context
e, statement, parameters, cursor, context
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/engine/base.py", line 1473, in _handle_dbapi_exception
util.raise_from_cause(sqlalchemy_exception, exc_info)
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/util/compat.py", line 398, in raise_from_cause
reraise(type(exception), exception, tb=exc_tb, cause=cause)
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/util/compat.py", line 152, in reraise
raise value.with_traceback(tb)
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/engine/base.py", line 1249, in _execute_context
cursor, statement, parameters, context
File "/usr/local/lib/python3.6/site-packages/sqlalchemy/engine/default.py", line 552, in do_execute
cursor.execute(statement, parameters)
sqlalchemy.exc.OperationalError: (psycopg2.OperationalError) server closed the connection unexpectedly
This probably means the server terminated abnormally
before or while processing the request.
Ошибка произошла в простом запросе, который обычно работает.
Позже я создал новую страницу, на которой вызвал только два последних API и показал результаты на веб-странице, она работает.
Затем на веб-странице я вызывал все 7 API один за другим - например, первый API получает ответ от колбы, затем вызывает второй API и так далее. В этом эксперименте также последние два API получили ту же ошибку
Эта ошибка является промахом, как отследить ошибку
Раньше я имел доступ к базе данных в Docker-контейнере Postgres на фляге с помощью движка sqlalchemy -
from sqlalchemy import create_engine
engine = create_engine('postgresql+psycopg2://postgres:postgres@localhost:5432/customer',
pool_size=20, max_overflow=10,
)
Как это решить
РЕДАКТИРОВАТЬ
Postgresql – ЖУРНАЛ внутри контейнера докера –
после вызова веб-страницы возникла та же проблема, в журналах postgres я получил это -
LOG: statement: BEGIN
LOG: statement: <other query>
LOG: statement: ROLLBACK
LOG: statement: BEGIN
LOG: statement: <other query>
LOG: statement: ROLLBACK
LOG: statement: BEGIN
LOG: statement: <other query>
LOG: statement: ROLLBACK
LOG: statement: ROLLBACK
в docker-compose.yml
version: "3.4"
services:
postgres:
container_name: postgres_db
restart: unless-stopped
image: postgres:9.6.24
command: ["postgres", "-c", "logging_collector=on", "-c", "log_directory=./postgres_db_logs", "-c", "log_filename=postgresql.log", "-c", "log_statement=all"]
ports:
- "5432:5432"
environment:
POSTGRES_USER: 'postgres'
POSTGRES_PASSWORD: 'postgres'
volumes:
- ./pgdata:/var/lib/postgresql/data
Для каждого API я создаю сеанс и закрываю его правильно,
в инициализации:
session = sessionmaker(bind=engine)
self.Session = scoped_session(session)
и в каждом API
def get_customer_data(self):
session = self.Session()
try:
....
except:
....
finally:
session.close()
return data
@TanThien, не могли бы вы подсказать, как проверить производительность запроса, потому что я использовал sqlalchemy для нескольких фильтров на основе пользовательского ввода
вы можете использовать инструмент jmeter для стресс-тестирования вашего API. Вы также исправляете входной API и запрашиваете высокий CCU, чтобы увидеть медленные операции в вашей базе данных. Вы также включаете инструмент мониторинга в базе данных.






Я обнаружил проблему после отладки запроса в postgresql, установив pg_stat_statement и вызывая API, запрос занимает 38% cpu_portion и занимает более 10000 мс для завершения запроса.
Итак, я использовал технику индексирования в столбцах, по которым выполняется поиск. И запрос работает быстро и находит, пока нет проблем с остановкой соединения или откатом.
Код состояния 504 получен из ваших медленных операций в базе данных. вам следует проверить выполнение вашего запроса с высоким значением CCU для тестирования