Я работаю над вариантом использования, когда мне нужно импортировать внешние метаданные темы Kafka в атлас apache. У меня есть несколько уточняющих вопросов, которые перечислены ниже:

Я также работаю над чем-то похожим по внешней теме Kafka и Атласу, и у меня почти такие же вопросы.
Что касается вашего третьего вопроса, я думаю, что отчасти причина того, что нет графа происхождения тем Kafka, заключается в том, что Kafka - это просто шина обмена сообщениями. Сообщения Kafka неизменяемы, поэтому нет DML, такого как HBase или Hive, хотя в HBase таблицы обновляются по «версии» с одним и тем же ключом строки.
В каждой теме Kafka есть настройка периода хранения, по умолчанию 7 дней, в течение которой, независимо от того, были ли использованы просроченные сообщения темы или нет, просроченные сообщения будут удалены из журнала. Исходя из этого, мало смысла отслеживать "удаленные" сообщения.
В конце концов, основная роль Kafka - средство обмена сообщениями для доставки сообщений от источника к месту назначения. Он может временно кэшировать сообщения, но это не то же самое, что база данных. Я не очень уверен в использовании транспортной компании для работы на складе.
Удалось ли вам настроить внешнюю кафку в атлас. Я пытаюсь сделать то же самое. Любые предложения будут очень полезны.