Вершина потухшего вулкана на Гавайях может показаться далеко не самым лучшим местом для работы над повышением надежности компьютерных микросхем, но именно эту площадку инженеры компании Fujitsu предпочли хорошо оснащенной лаборатории в Токио.
Исследователи попытались выяснить, как космические лучи вызывают сбой в работе компьютеров. Космические частицы высокой энергии поглощаются при прохождении через земную атмосферу.
По словам Йошихари Тосака, менеджера отдела инженерии надежных систем компании Fujitsu, вершина вулкана Мауна-Кеа как нельзя лучше подходит для таких исследований, поскольку на высоте 4200 метров над уровнем моря интенсивность космических лучей примерно в 16 раз больше, чем, например, в Токио.
При столкновении космических лучей с атомами кислорода, углерода или азота из ядра атома может высвобождаться нейтрон. Если этот нейтрон затем столкнется с атомом кремния, то он может разделить атомное ядро на более мелкие заряженные частицы. Если же этот атом кремния расположен на микросхеме памяти, заряженные частицы вполне могут изменить содержимое ячейки памяти, породив в результате так называемый «случайный сбой». Такая ситуация может вылиться в какие-либо некорректности работы программы — от изменения цвета единичного пиксела до серьезных проблем в работе приложения.
Случайный сбой в отдельно взятой ячейке возникает крайне редко, но по мере совершенствования полупроводниковых технологий количество ячеек на микросхему быстро растет, и поэтому, как заметил Тосака, вероятность возникновения подобной ошибки, значительно увеличивается.
Для борьбы с такого рода ошибками можно добавить в микросхему механизм кода коррекции ошибок или выбрать материалы, менее чувствительные к радиации. Однако, если делать это для всех микросхем, то цены на них значительно возрастут, поэтому инженеры работают над моделированием различных случайных сбоев, которые могут возникать на данной микросхеме, чтобы понять, куда именно направить свои усилия. Получить точные данные на моделях трудно, поскольку эти ошибки возникают крайне редко, к тому же немаловажную роль при этом играют конкретные условия в том географическом месте, где используются данные микросхемы.
Вот почему свои исследования Fujitsu проводит на Мауна-Кеа.
Вместе с учеными из Национальной астрономической обсерватории Японии специалисты Fujitsu в течение трех месяцев проводили измерения внутри и снаружи здания, где установлен японский телескоп Subaru, один из 13, расположенных на вершине Мауна-Кеа.
Измерялась как динамика возникновения случайных сбоев, так и интенсивность потока нейронов, для того чтобы оценить взаимосвязь между ними. Проводя свои измерения, ученые смогли установить, в какой степени стены этого здания способствовали защите микросхем от космических лучей. Исследователи также провели измерения в Токио, чтобы сравнить полученные на вулкане данные с показателем интенсивности космических лучей вблизи уровня моря.
В результате инженерам удалось значительно более точно смоделировать влияние космических лучей не только на микросхемы в целом, но и на микросхемы, находящиеся в данной местности, и это, как подчеркнул Тосака, должно позволить компании разрабатывать более надежные компьютеры и устройства.
Проведя работы на Мауна-Кеа, в Fujitsu потратили на сбор нужных данных в восемь раз меньше времени, чем потребовалось бы на это в Токио.
Проблема случайных сбоев особенно остро проявилась в 2000 году, когда партия выпущенных IBM микросхем оперативной памяти, которые оказались слишком подвержены случайным сбоям, была установлена в серверах Sun Microsystems. В этих машинах стали возникать повторяющиеся системные ошибки, многие из которых можно было устранить только путем перезагрузки.
Результаты экспериментов уже используются при производстве некоторых микросхем Fujitsu.
Компания сообщила подробности своего исследования на недавнем симпозиуме International Reliability Physics Symposium в Фениксе.