Синтаксическая ошибка ParseException при использовании Python ODBC с драйвером ODBC Cloudera Impala в Ubuntu

У нас есть приложение Python 3.7, работающее на экземпляре AWS EC2 (Amazon Linux), которое выполняет запросы SQL к сервису Cloudera Impala с использованием pyodbc (4.0.27) и драйвера ODBC Cloudera Impala (установленного с помощью ClouderaImpalaODBC-2.6.5.rpm). Это приложение успешно работает уже несколько лет.

В настоящее время я пытаюсь запустить приложение в контейнере Docker под управлением Ubuntu 18.04.4 LTS, но у меня возникают проблемы со следующей ошибкой при выполнении даже самого простого запроса (например, SELECT 'HELLO'):

Error: ('HY000', '[HY000] [Cloudera][ImpalaODBC] (110) Error while executing a query in Impala: [HY000] : ParseException: Syntax error in line 1:\\n\ufffd\ufffd\ufffd\ufffd\ufffd\ufffd\ufffd\\n^\\nEncountered: Unexpected character\\nExpected: ALTER, COMMENT, COMPUTE, COPY, CREATE, DELETE, DESCRIBE, DROP, EXPLAIN, GRANT, INSERT, INVALIDATE, LOAD, REFRESH, REVOKE, SELECT, SET, SHOW, TRUNCATE, UPDATE, UPSERT, USE, VALUES, WITH\\n\\nCAUSED BY: Exception: Syntax error\\n\\x00\u6572\u3a64\u5520\u656e\u7078\u6365\u6574\\u2064\u6863\u7261\u6361\u6574\u0a72 (110) (SQLExecDirectW)')"}

Излишне говорить, что это похоже на проблему кодирования строк.

Некоторая уборка контекста:

  • код Python в обеих системах (Amazon Linux/Ubuntu) идентичен
  • установки драйвера Impala ODBC в обеих системах имеют одинаковую версию (2.6.5); драйвер Impala ODBC для Ubuntu был загружен непосредственно с веб-сайта Cloudera (https://www.cloudera.com/downloads/connectors/impala/odbc/2-6-5.html)
  • параметры подключения Impala ODBC идентичны, за исключением элементов, специфичных для ОС:
    • «ХОСТ»: «[хост]»
    • "ПОРТ": 21050
    • "База данных": "[база данных]
    • "UID": "[имя пользователя]"
    • "PWD": "[пароль]"
    • "Драйвер": "{/opt/cloudera/impalaodbc/lib/64/libclouderaimpalaodbc64.so}"
    • "Использовать SASL": 1
    • "АутМех": 3
    • "SSL": 1
    • "КАИСсуедцертнамесмисматч": 1
    • "TrustedCerts": "[path_to_certs_file]"
    • "TSaslTransportBufSize": 1000
    • "Ровсфетчедперблок": 10000
    • «Таймаут сокета»: 0
    • "StringColumnLength": 32767
    • «Усенативкуери»: 0
  • Похоже, что приложение успешно подключается к Impala, так как нет ошибок при вызове pyodbc.connect(**config, autocommit=True) или получении курсора из соединения (чтобы убедиться в этом, пытались использовать недопустимые учетные данные и получали обычные ошибки подключения, когда учетные данные неверны). Подробности сообщения об ошибке указывают на то, что используется правильный драйвер ODBC.

Я пробовал играть с разными значениями для параметра драйвера ODBC Impala «DriverManagerEncoding», такими как «UTF-16», «UTF-32», или вообще не иметь его (что имеет место для установки Amazon Linux), но всегда получаю та же ошибка.

Я также попытался использовать инструмент odbclinux isql в обеих системах, чтобы попытаться устранить неполадки таким образом; смог успешно подключиться из системы Amazon Linux, но никогда не смог подключиться к Ubuntu - постоянно получаю следующее (не уверен, связано ли это или какая-то другая проблема):

iusql -v [DSN]
[unixODBC][
[ISQL]ERROR: Could not SQLDriverConnect
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
0
25
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Нашел виновника - это была настройка DriverManagerEncoding в /opt/cloudera/impalaodbc/lib/64/cloudera.impalaodbc.ini:

[Driver]

## - Note that this default DriverManagerEncoding of UTF-32 is for iODBC.
## - unixODBC uses UTF-16 by default.
## - If unixODBC was compiled with -DSQL_WCHART_CONVERT, then UTF-32 is the correct value.
##   Execute 'odbc_config --cflags' to determine if you need UTF-32 or UTF-16 on unixODBC
## - SimbaDM can be used with UTF-8 or UTF-16.
##   The DriverUnicodeEncoding setting will cause SimbaDM to run in UTF-8 when set to 2 or UTF-16 when set to 1.

DriverManagerEncoding=UTF-32
ErrorMessagesPath=/opt/cloudera/impalaodbc/ErrorMessages/
LogLevel=0
LogPath=
SwapFilePath=/tmp


## - Uncomment the ODBCInstLib corresponding to the Driver Manager being used.
## - Note that the path to your ODBC Driver Manager must be specified in LD_LIBRARY_PATH (LIBPATH for AIX).
## - Note that AIX has a different format for specifying its shared libraries.

# Generic ODBCInstLib
#   iODBC
# ODBCInstLib=libiodbcinst.so

#   SimbaDM / unixODBC
#ODBCInstLib=libodbcinst.so

# AIX specific ODBCInstLib
#   iODBC
#ODBCInstLib=libiodbcinst.a(libiodbcinst.so.2)

#   SimbaDM
#ODBCInstLib=libodbcinst.a(odbcinst.so)

#   unixODBC
ODBCInstLib=libodbcinst.a(libodbcinst.so.1)

Этот файл был автоматически сгенерирован как часть установки драйвера. Обратите внимание на комментарии по поводу iODBC и unixODBC — мы установили только последний.

Как только я прокомментировал эту конфигурацию, наше приложение Python заработало. Это также устранило проблему с iusql (которая является частью установки unixODBC).

Бонусный контент:

Я также столкнулся с проблемой с iqsl (не iusql) - получаю эту ошибку/вывод для команды isql -v [DSN]:

[S1000][unixODBC][Cloudera][ODBC] (11560) Unable to locate SQLGetPrivateProfileString function.
[ISQL]ERROR: Could not SQLConnect

Ошибка связана с параметром конфигурации ODBCInstLib в том же ini файле. Как только я изменил его со стандартного libodbcinst.a(libodbcinst.so.1) на /usr/lib/x86_64-linux-gnu/libodbcinst.so, все заработало. Нашел ответ в этом посте, который действительно помог решить мои первоначальные проблемы:

Не могу подключиться к снежинке через unixODBC. Ошибка: [S1000][unixODBC][Snowflake][ODBC] (11560) Не удалось найти функцию SQLGetPrivateProfileString.

Другие вопросы по теме