Что такое кеш интернета? Вы бы для начала указали, что в вашем понимании "интернет". Гугл работает таким образом, что став доступным в интеренете, любой сайт попадает когда нибудь в список на кравлинг ботами. Боты залазят на сайт, проходят по всем возможным страницам на которые смогут получить доступ и пишут себе в базу полезные значения по заголовкам, текстам где всё потом индексируется.
И уже при поиске, система получает ваш запрос, проводит обратную индексацию и выдает вам результат наиболее похожий под то что лежит в базе под схожими индексами.
Если ваш сайт закрыт доступами то гугл дальше чем стартовая страница не проникнет. Сообщения в личке на разных форумах он читать не может, только все публично открытое что мог бы прочитать любой человек.
Когда говорят "хранит весь интернет" то для меня это как минимум миллиарды значений в тысячах баз данных. А это невозможно.