Я использую частный кластер GKE (версия 1.23.14-gke.1800). У меня есть следующие ошибки в журналах модуля kube-system gke-metrics-agent:
** ошибка uasexporter/exporter.go:190 Ошибка экспорта метрик в UAS {"kind": "exporter", "name": "uas", "error": "ошибка чтения из потока: ошибка rpc: code = PermissionDenied desc = У вызывающего абонента нет разрешения"}
Error uasexporter/exporter.go:226 не удалось получить ответ от UAS {"kind": "exporter", "name": "uas", "error": "ошибка rpc: code = PermissionDenied desc = у вызывающего абонента нет разрешения "} **
Приложение gke-metrics-agent
Компонент gke-metrics-agent
Контейнер gke-metrics-agent
Имя файла /var/log/pods/kube-system_gke-metrics-agent-9rbfv_6896b214-31d2-43bb-b15d-a8e1b122d41d/gke-metrics-agent/0.log
Работа kube-system/gke-metrics-agent
Пространство имен kube-system
Node_name gke-gke-production-production-88f13984-h83x
Модуль gke-metrics-agent-9rbfv
Поток stderr
apiVersion: v1
kind: ServiceAccount
metadata:
creationTimestamp: "2022-12-07T10:20:55Z"
labels:
addonmanager.kubernetes.io/mode: Reconcile
name: gke-metrics-agent
namespace: kube-system
resourceVersion: "444"
uid: ...
secrets: ..
- name: gke-metrics-agent-token-6zhvq
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
creationTimestamp: "2022-12-07T10:20:56Z"
labels:
addonmanager.kubernetes.io/mode: Reconcile
name: gke-metrics-agent
resourceVersion: "452"
uid: ...
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: gke-metrics-agent
subjects:
- kind: ServiceAccount
name: gke-metrics-agent
namespace: kube-system
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
creationTimestamp: "2022-12-07T10:20:56Z"
labels:
addonmanager.kubernetes.io/mode: Reconcile
name: gke-metrics-agent
resourceVersion: "67979037"
uid: ...
rules:
- apiGroups:
- ""
resources:
- nodes
verbs:
- get
- list
- watch
- apiGroups:
- ""
resources:
- pods
verbs:
- list
- watch
- apiGroups:
- policy
resourceNames:
- gce.gke-metrics-agent
resources:
- podsecuritypolicies
verbs:
- use
Я думаю, что gke-metrics-agent — это официальный демонсет, автоматически загружаемый в GKE. Очевидно, что это какая-то проблема с разрешением, но я даже не знаю, что означает UAS. Я не могу найти никакой значимой информации в документации GCP или в Интернете. Я попытался предоставить некоторые дополнительные кластерные роли (system:gke-uas-metrics-reader, external-metrics-reader) текущей учетной записи службы gke-metrics-agent, но проблема не устранена.
Время от времени я также обнаруживаю следующие проблемы в своем кластере: Агрегированный API Kubernetes v1beta1.metrics.k8s.io/default сообщает об ошибках Агрегированный API Kubernetes v1beta1.metrics.k8s.io/default был доступен только на 75% за последние 10 м. Думаю, они связаны с этим вопросом.
Я буду очень благодарен, если кто-то даст мне хотя бы несколько направлений. Спасибо за ваше время и извините за мой английский!
UAS расшифровывается как Unified Autoscaling Platform и предоставляет прогнозируемые и запланированные рекомендации по размеру для серверной части Autoscaler, он предоставляет дополнительный сигнал зональному Autoscaler для Predictive Autoscaling и Scheduled Autoscaling.
В настоящее время существует известная проблема, связанная с UAS. Это происходит из-за проблемы LoggingMonitorConfig, над которой работает Google. Для получения дальнейших обновлений по этому вопросу перейдите по ссылке выше. Разместите комментарий в приведенной выше ссылке и попросите их найти обходной путь, если он есть на данный момент.
Если вы обнаружите какую-либо проблему с продуктами Google и хотите отправить запрос на добавление функции, воспользуйтесь ссылкой Публичный трекер проблем.