Предупреждение: я новичок в области глубокого обучения
Я тренирую свою двухслойную Lstm-модель на наборе данных анекдотов (231657 анекдотов) и хочу знать 4 вещи:
Я тренирую его сейчас на 50 символах в предложении, если я хочу, чтобы он генерировал новые шутки, мне нужно сначала ввести 50 символов или я могу случайным образом нарисовать один символ, чтобы начать предложение / шутку?
Разве не полезно обучать его только на 50 символах за 1,8 млн. всего (вектор [10800001, 50, 1]) или это хорошо?
Я использовал класс, в котором я инициализировал свою модель, поэтому я могу его вызвать, к сожалению, если я хочу создать длинное предложение / несколько предложений, мне нужно вызывать свой оператор прогноза более одного раза, проблема в том, что мой оператор прогноза сначала запускает модель и затем предсказать значение, поэтому мне нужно использовать tf.reset_default_graph()
, но через некоторое время это займет больше времени.
Итак, что мне делать, чтобы предотвратить эту проблему? Может быть, мне запустить модель в основном скрипте или что-то в этом роде?
Не всегда обязательно делать свою модель как класс. Вы можете просто сделать модель один раз процедурным способом, обучить ее, а затем сохранить с помощью tf.Saver ()