Итак, вы слышали, что китайская компания DeepSeek разработала искусственный интеллект мирового класса по дешевке, используя при этом лишь малую часть вычислительной мощности, на которую полагаются крупные американские компании, и, возможно, вы задаетесь вопросом:
Как это возможно?
Конечно, есть куча технических объяснений. Но есть и более глубокое: человеческая природа.
Я узнал об этом, когда писал о российских стартапах в сфере программного обеспечения в конце 1980-х годов, однако это часть сегодняшней истории, о которой американские лидеры и политики в сфере технологий, похоже, не говорят… хотя должны бы.
Когда Советский Союз распался в конце 1980-х, я часто ездил туда, чтобы писать о первых зарождающихся капиталистических частных предприятиях. К тому времени я уже несколько лет освещал технологическую индустрию США и был особенно заинтересован в поиске молодых российских компаний-разработчиков программного обеспечения .
Их было довольно много, и, что удивительно, некоторые из них решали проблемы, которые ставили в тупик американские компании, и делали это с минимальной вычислительной мощностью. Например, московский стартап ParaGraph создал программное обеспечение, которое могло распознавать рукописный текст гораздо лучше, чем все, что было создано в США. Когда Apple создала свой карманный компьютер Newton (представленный в 1993 году), Apple заключила контракт с Paragraph, потому что не смогла найти здесь ничего лучшего.
В своих репортажах я спрашивал многих россиян об этом явлении. Десятилетиями Запад не давал Советскому Союзу приобретать новейшее компьютерное оборудование. Российские программисты, которые до 1990-х годов работали на государственных предприятиях или в армии, рассказывали мне, что им приходилось выполнять свою работу на громоздких машинах, которым уже несколько поколений. Но в то же время советские лидеры давили на них, чтобы они не отставали от западного программного обеспечения. Конкуренция с США была жесткой, и Советы не хотели проигрывать.
Вот тут-то и вступает в игру человеческая натура. Что бы вы сделали, если бы вам пришлось конкурировать с кем-то, у кого гораздо больше ресурсов? Ну, у вас было бы два варианта: сдаться или проявить креативность. Многие русские программисты проявили креативность. Они придумали, как сделать гораздо больше с гораздо меньшими затратами, потому что им это было необходимо.
Сначала, когда Советский Союз был цел, эта креативность в основном просто радовала боссов программистов. Но когда советская система рухнула, многие талантливые программисты покинули государственные предприятия, чтобы основать или присоединиться к местным стартапам в области программного обеспечения. Многие быстро обнаружили — иногда к своему удивлению — что они могут конкурировать с американскими компаниями-разработчиками программного обеспечения, предлагая хорошее программное обеспечение, требующее гораздо меньше вычислительной мощности.
Одним из таких успехов был Paragraph. Другим был ABBYY FineReader, один из первых полезных программных продуктов для оптического распознавания символов. Он вышел в 1993 году и стал мировым лидером в области распознавания текста и управления документами. Другим был всемирно известный игровой Tetris. Еще один дебютировал немного позже, в 1997 году: Kaspersky Antivirus, который некоторое время был одним из лучших мировых антивирусных программных инструментов.
Перенесемся в наши дни, и увидим, что DeepSeek — это своего рода продолжение этого фильма.
Мы долгое время пытались не допустить поставки передовых компьютеров и чипов из Китая. В 2022 году правительство США ввело экспортный контроль, чтобы чипы вроде H100 от Nvidia не попали в руки китайцев. Экспортный контроль оказался эффективным. Когда DeepSeek начала работать над своим ИИ, у нее было около 10 000 старых чипов Nvidia, которые ей удалось собрать вместе. Напротив, OpenAI работает как минимум на в 10 раз большем количестве процессоров, и эти чипы являются самыми передовыми от Nvidia. (По крайней мере, один источник сообщает, что OpenAI работает на 720 000 чипов Nvidia.)
Давление от конкуренции, когда вы являетесь огромным аутсайдером, разжигает креативность. Программисты DeepSeek были умнее американских программистов, потому что им приходилось быть такими. Имея огромную вычислительную мощность, американские кодеры могли позволить себе более расточительные пути для создания своих ИИ. У китайских кодеров такой роскоши не было.
Что касается технических объяснений, то я не особо помогаю. Я не знаю ни черта о разработке ИИ. Но в Wired есть немного о том, как DeepSeek это сделал:
DeepSeek пришлось придумать более эффективные методы обучения своих моделей. «Они оптимизировали архитектуру своей модели, используя ряд инженерных трюков — специальные схемы связи между чипами, уменьшение размера полей для экономии памяти и инновационное использование подхода «смешивание моделей», — говорит Венди Чанг, инженер-программист, ставший политическим аналитиком в Институте исследований Китая имени Меркатора. — Многие из этих подходов не являются новыми идеями, но их успешное объединение для создания передовой модели — это выдающийся подвиг».
Можно ли чему-то научиться из истории российского программного обеспечения в 1990-х годах и китайского искусственного интеллекта в 2020-х годах?
Ну, во-первых, самоуверенность опасна. Это главная причина, по которой побеждают аутсайдеры, будь то ИИ или футбол.
Я прочитал одну историю о DeepSeek, цитирующую генерального директора Anthropic Дарио Амодеи, который был сторонником жесткого экспортного контроля, чтобы не допустить поставки лучших чипов в Китай. В этой истории на Techcrunch говорится: «Если Трамп ужесточит правила экспорта и не позволит Китаю получить то, что Амодеи описывает как «миллионы чипов» для разработки ИИ, США и их союзники потенциально могут установить «командное и долгосрочное лидерство», утверждает Амодеи».
Но это напоминает мне IBM примерно в 1980 году, которая считала, что персональные компьютеры никогда не станут угрозой ее громадным мэйнфреймам. Технология, которая достаточно хороша, намного дешевле и намного проще в развертывании, часто надирает задницу технологии, которая является самой лучшей, очень дорогой и мучительной в развертывании. ( Подробнее об этом читайте в статье «Дилемма инноватора» .)
И еще, бесконечные ресурсы не всегда хорошо. Это еще один аспект человеческой натуры. Это слишком легко приводит к расточительству, лени, бюрократии и классическому «слишком много поваров».
Я не говорю, что это верно для всех американских компаний ИИ, потому что я не знаю. И это не имело бы значения, если бы не было голодных и тощих конкурентов, нацеленных на них. Но OpenAI привлек около 18 миллиардов долларов. Anthropic — около 7 миллиардов долларов. Американские компании ИИ собирают исторически огромную вычислительную мощность. Ресурсы, которые здесь бросаются на ИИ, почти невообразимы.
И вполне возможно, что это не поможет.
–
Я написал довольно много историй для USA Today в начале 1990-х годов о новых российских компаниях-разработчиках программного обеспечения, и они часто включали что-то о творческом использовании вычислительной мощности российскими программистами. Это одна из коротких историй, которая была посвящена этому.