Бро, ну чо ты такой доверчивый? Это нейросети. Заметь сколько склеек каждые 5-10 сек, и звук при этом сплошной, без склеек. Все потому-то нейросеть не умеет генерировать больше 5-10 сек за раз (в зависимости от сервиса), а звук живой наложили, и им было лень каждый стык видео делать новый дубль звука.