В смысле "еще цветочки"? Даже близко нет. Все эти образцы в видео объединяет одно - они очень простые. Единственная сложность там в момент прохода по улице в Токио, и ее источник совершенно понятен, это запись с уличной камеры. То есть в этих примерах отсутствует главное - сюжет.
Вот пример ролика, очевидно созданного с использованием нейросетей, но имеющего явный связный сюжет, синхронизированный с текстом и музыкой.
Попробуйте написать промпт для показанного ролика. Удачи. Собственно для этого и выкатили недавно апдейт с промптами на несколько тысяч страниц...но этого тут не хватит. Это будет "нейропрограммирование в стиле акына", которое очень быстро упрется в комбинаторный взрыв, для чего изначально и были придуманы методы декомпозиции, в частности спрайты и скрипты.
Да даже если взять не полноценное видео, а всего лишь тематическую заставку.
Вот как тут
или тут
Сгенерировать именно такую заставку, чтобы она точно подходила к тексту и композиции - сама нейросеть хер осилит. Вот тут уже нужен талант дизайнера.