Для этого никакой ИИ не нужен. Либо синтезатор текст-голос который на ИИ ну никак не тянет, либо нарезка фраз в небольших аудио файлах и воспроизводим нужные куски.
Давно в автобусах не ездил и недавно удивился что цивилизация до городского общественного транспорта уже дошла, остановки сами объявляются, кстати без хрипения.