Компания Nvidia запускает в Великобритании новый суперкомпьютер стоимостью $100 млн, который будет проводить расчеты для системы здравоохранения. Ставка на вычислительные мощности компьютеров такого типа особенно актуальна в то время как страна борется с пандемией COVID-19.
Суперкомпьютер Cambridge-1 станет самым мощным на территории Соединенного Королевства. А в глобальном соревновании займет 41 строчку. Система построена на кластере, в основе которого лежит технология Nvidia DGX SuperPod. Это 80 процессоров, в каждом из которых по 8 тензорных ядер A100. В общей сложности — 640 GPU. В режиме линейных вычислений Linpack система выдает 8 петафлопс, в режиме ИИ — 400 петафлопс. При этом во время работы суперкомпьютера он будет питаться энергией из возобновляемых источников.
Отметим, что Nvidia — производитель видеокарт для компьютеров. Поэтому ставка делается на ядра CUDA, обычно использующиеся в быту для графических вычислений. Как показала практика, ядра Nvidia нередко превосходят аналогичные системы, построенные на «традиционных» процессорах.
С помощью новой вычислительной машины британцы надеются быстрее решать задачи в сфере здравоохранения. Суперкомпьютер сможет задействовать специальную нейросеть-трансформер. Такой «продвинутый» тип нейросетей начали внедрять только в последние несколько лет.
«По аналогии с рекуррентными нейронными сетями (РНС) трансформеры предназначены для обработки последовательностей, таких как текст на естественном языке, и решения таких задач как машинный перевод и автоматическое реферирование. В отличие от РНС, трансформеры не требуют обработки последовательностей по порядку. Например, если входные данные — это текст, то трансформеру не требуется обрабатывать конец текста после обработки его начала. Благодаря этому трансформеры распараллеливаются легче чем РНС и могут быть быстрее обучены».
Nvidia сотрудничает с разработчиком британской вакцины от COVID-19 — AstraZeneca. Плодом такого альянса должны стать модели химических соединений, построенные с помощью нейросети-трансформера. При этом машинное обучение нового типа не требует такого количества заранее подготовленной информации, как предыдущие версии. То есть, можно быстро «скармливать» ей данные, не занимаясь долгой предварительной подготовкой машины к проведению расчетов.
Новейший суперкомпьютер станет инструментом создания новых лекарств, то есть, формула будет основана не только на результатах лабораторных тестов и мирового опыта, но и на данных, которые будут получены в ходе тренировки нейросети. По этой линии исследований с Nvidia сотрудничает GSK.
Более того, многие болезни теперь можно будет понять на клеточном уровне. В частности будет изучаться деменция, рассеянный склероз, рак мозга. Для этого сканируются миллионы МРТ-сканов мозга человека. Тем временем, исследование генома позволит быстрее находить нарушения, способные стать причиной генетических заболеваний. Так партнер Nvidia, ONT, утверждает, что на анализ сэмплов ДНК теперь будут уходить не дни, а часы.
Nvidia надеется, что Cambridge-1 повлияет на развитие не только британской, но и мировой медицины. По оценкам Frontier Economics, на которую ссылается издание VentureBeat, положительный эффект для экономики от использования суперкомпьютера за десять лет составит $831 млн.
Разумеется, американцы не только хотят победить коронавирус, но и получить максимальное количество заказов на подобные системы. Поэтому Cambridge-1 станет чем-то вроде витрины для потенциальных заказчиков и из других стран и из других секторов экономики. Выбор медицинской сферы как стартового проекта вполне логичен, ведь сегодня именно к ней приковано внимание всего мира. Для той же AstraZeneca сотрудничество также крайне выгодно, так как она получает возможность первой получить уникальную информацию о том как работает организм человека, и обойти конкурентов — производителей вакцин и лекарств.
Если вернуться к значению Cambridge-1 для глобального здравоохранения, то суперкомпьютер впервые сможет переработать весь необходимый объем информации, которая до сих пор копилась в базах данных.
Например, речь идет об известном экспериментальном хранилище UK Biobank. О нем стоит рассказать отдельно. С 2006 года уже 500 тыс. добровольцев в возрасте от 40 до 69 лет присоединились к специальному исследованию, которое будет длиться как минимум три десятилетия. Собирается информация о том, как прогрессируют те или иные заболевания на фоне влияния внешней среды, стиля жизни, употребления лекарств, и генетической предрасположенности испытуемых. Теперь нейросеть может проанализировать весь этот огромный пласт, что поможет ученым прийти к правильным выводам относительно того, как должны разрабатываться новые препараты, чтобы добиться их максимальной эффективности.
Ожидается, что машинное обучение поможет также быстрее ставить правильные диагнозы, усовершенствует процесс проведения рутинных скринингов вроде проверки на рак груди у женщин и в целом дополнит информацию, находящуюся в распоряжении врача, чтобы тот мог адекватно оценить существующие риски.
Дополнительную привлекательность решению от Nvidia обеспечивает простота построения суперкомпьютеров на базе DGX SuperPod. Обычно сверхмощные датацентры и вычислительные кластеры создаются месяцами или даже годами. Однако американская технология уже отработана на Selene. Это суперкомпьютер, который был создан Nvidia для внутреннего использования. На нем были протестированы все системы — от охлаждения до хранения данных. Таким образом, своим клиентам американская компания предлагает уже готовое решение-конструктор. По словам руководства Nvidia, построение датацентров на DGX SuperPod занимает считанные недели. И еще одна важная особенность: все суперкомпьютеры Nvidia будут способны работать и обучаться в едином облаке. Это значит, что со временем они научатся работать еще лучше.
После Cambridge-1 Nvidia планирует создать так называемый AI Center for Excellence, который будет расположен в Кембридже. В нем будет установлен еще один суперкомпьютер на архитектуре Arm. Эта машина будет предназначена для работы по широкому спектру направлений и сможет обслуживать разные сектора экономики Великобритании.
Напомним, в американском университете Беркли заработал новый суперкомпьютер, который быстрее всех в мире решает задачи в сфере искусственного интеллекта. Но уже через два года лидер в мире суперкомпьютеров может смениться.