Автор, вы пытались перевести то, что написано у вас на картинке?
"Вот основные домены, на которые ссылаются большие языковые модели (LLM), такие как ChatGPT и Perplexity." - это иметься ввиду топ доменов, откуда LLM берёт цитаты / инфо при поиске онлайн, а не их база обучения. Базы обучения каждой (или многих) нейроситей - тайна компаний, не разглашается публично.
Второе - виноваты сами пользователи. Ибо вместо того, чтобы составлять запрос на подобие "используй только достоверные источники, такие как, но не ограничиваясь: научные исследования, теорию, официальные данные достоверных и признанных мировых источников и экспертов. Не использую данные из форумов, ютуба, жёлтой прессы.." чаше всего запросы выглядят "найди мне...." - ясен пень, оно будет искать то, что более доступно и проще найти.