А что за нейросеть такая?
Пользовался уже несколькими, которые по текстовому описанию что-то генерируют. Так полную хрень рисуют, не соответствующую запросу вообще никак, либо очень отдаленно, а тут - как будто бы сеть не только слова, но и контекст улавливает.
Больше смахивает на работу художника - ну или, как минимум, постобработку.