banner

Новости

Jun 18, 2023

Соблюдение закона Мура становится все сложнее

Было время, десятилетия, когда для создания лучшего компьютерного чипа требовались лишь транзисторы меньшего размера и более узкие межсоединения. Это время уже давно прошло, и хотя транзисторы будут продолжать становиться все меньше, просто сделать их такими уже не имеет смысла. Единственный способ сохранить экспоненциальный темп вычислений сейчас — это схема, называемая совместной оптимизацией системных технологий, или STCO, заявили исследователи на ITF World 2023 на прошлой неделе в Антверпене, Бельгия. Это возможность разбить чипы на функциональные компоненты, использовать оптимальные транзисторы и технологию межсоединений для каждой функции, а затем соединить их вместе, чтобы создать более эффективно функционирующее целое с меньшим энергопотреблением.

«Это приводит нас к новой парадигме КМОП», — говорит менеджер по исследованиям и разработкам Imec Мари Гарсиа Бардон. CMOS 2.0, как называет ее бельгийская исследовательская организация в области нанотехнологий, представляет собой сложную концепцию. Но, возможно, это наиболее практичный путь вперед, и некоторые его аспекты уже очевидны в самых совершенных сегодня чипах.

В каком-то смысле полупроводниковая промышленность была испорчена десятилетиями, предшествовавшими примерно 2005 году, говорит Жюльен Рикарт, вице-президент по исследованиям и разработкам компании Imec. За это время химики и физики устройств смогли регулярно производить меньшие по размеру, с меньшим энергопотреблением и более быстрые транзисторы, которые можно было использовать для каждой функции чипа, и это привело бы к постоянному увеличению вычислительных возможностей. Но вскоре после этого колеса начали отходить от этой схемы. Специалисты по устройствам могли бы придумать отличные новые транзисторы, но эти транзисторы не позволяли создавать более совершенные и меньшие по размеру схемы, такие как память SRAM и стандартные логические ячейки, составляющие основную часть процессоров. В ответ производители микросхем начали разрушать барьеры между конструкцией стандартных элементов и разработкой транзисторов. Новая схема, получившая название «совместная оптимизация технологии проектирования», или DTCO, привела к созданию устройств, специально разработанных для улучшения стандартных ячеек и памяти.

Но DTCO недостаточно для продолжения работы вычислений. Ограничения физики и экономические реалии сговорились поставить барьеры на пути к созданию универсального транзистора. Например, физические ограничения не позволяют рабочему напряжению КМОП упасть ниже примерно 0,7 В, что замедляет рост энергопотребления, — объясняет Анабела Велосо, главный инженер Imec. Переход на многоядерные процессоры помог на время решить эту проблему. Между тем, ограничения ввода-вывода означали, что становилась все более и более необходимой интеграция функций нескольких микросхем в процессор. Таким образом, в дополнение к системе на кристалле (SoC), имеющей несколько экземпляров процессорных ядер, они также объединяют сеть, память и часто специализированные ядра обработки сигналов. Мало того, что эти ядра и функции имеют различную мощность и другие потребности, их также нельзя уменьшать с одинаковой скоростью. Даже кэш-память процессора, SRAM, сокращается не так быстро, как логика процессора.

Вывести ситуацию из тупика — это такой же философский сдвиг, как и набор технологий. По словам Рикарта, STCO означает рассмотрение системы на кристалле как набора функций, таких как источник питания, ввод-вывод и кэш-память. «Когда вы начинаете рассуждать о функциях, вы понимаете, что SoC — это не однородная система, а просто транзисторы и межсоединения», — говорит он. «Это функции, оптимизированные для разных целей».

В идеале вы могли бы построить каждую функцию, используя наиболее подходящую для нее технологию. На практике это в основном означает создание каждого из них на отдельном кусочке кремния или чиплете. Затем вы объедините их вместе с помощью таких технологий, как расширенное 3D-стекирование, чтобы все функции работали так, как если бы они находились на одном куске кремния.

Примеры такого мышления уже присутствуют в современных процессорах и ускорителях искусственного интеллекта. Высокопроизводительный вычислительный ускоритель Intel Ponte Vecchio (теперь называемый Intel Data Center GPU Max) состоит из 47 микросхем, построенных с использованием двух разных процессов, каждый из которых произведен как Intel, так и Тайваньской компанией по производству полупроводников. AMD уже использует разные технологии для чиплетов ввода-вывода. и вычислительные чиплеты в своих процессорах, а недавно компания начала выделять SRAM для высокоуровневой кэш-памяти вычислительных чиплетов.

ДЕЛИТЬСЯ