У меня есть набор данных размером шесть миллионов, я рассматриваю пять миллионов как набор данных для поезда и 1 миллион как набор тестовых данных.
Я хочу снова разделить этот обучающий набор на пять - один миллион наборов данных. Первоначально я хочу построить свою модель с первым набором данных из миллиона, в дополнение к этому я хочу повторно обучить мою модель с оставшимися четырьмя наборами данных поезда. Просто я хочу обучить свою модель разделенным образом, вместо того, чтобы отдавать весь набор данных поезда за раз. Является ли это возможным? если возможно, какой API я должен использовать и Как я могу это сделать с помощью библиотеки weka?
Ниже приведены API, которые я хочу использовать в своем коде.
Я буду использовать buildClassifier (Instances intances) для начальной сборки модели. так могу ли я снова и снова вызывать buildClassifier () для оставшихся четырех наборов данных? это переобучить мою модель? или каждый раз строит новую модель с новым набором данных? если возможно, как я могу его запрограммировать?
если вышеуказанный случай невозможен с помощью buildClassifier (), я хочу использовать updateClassifier (экземпляр экземпляра), который принимает по одному экземпляру за раз, но я не хочу повторно обучать мою модель последовательным образом. Я хочу повторно обучиться в мини-пакетном режиме (давая набор экземпляров за раз). Как я могу это сделать с помощью Weka? или есть ли какой-либо другой API Java, который принимает набор экземпляров для обновления классификатора в библиотеке weka?




buildClassifier строит новый классификатор, он не обновляет текущий классификатор.