Довгострокові мережі короткочасної пам’яті в поперечних масивах мемристора

Предмети

Анотація

Нещодавні прориви в періодичних глибоких нейронних мережах з довгостроковою короткочасною пам’яттю (LSTM) призвели до значного прогресу в галузі штучного інтелекту. Однак ультрасучасні моделі LSTM зі значно підвищеною складністю та великою кількістю параметрів мають вузьке місце в обчислювальній потужності, що обумовлено як обмеженою ємністю пам'яті, так і обмеженою пропускною здатністю передачі даних. Тут ми експериментально демонструємо, що синаптичні ваги, спільно використовувані на різних етапах часу в LSTM, можуть бути реалізовані за допомогою мемристорного поперечного масиву, який має невеликий розмір контуру, може зберігати велику кількість параметрів і пропонує обчислювальні можливості в пам'яті, що сприяє обходу «вузьке місце фон Неймана». Ми ілюструємо здатність нашої поперечної системи як основного компонента у вирішенні реальних проблем регресії та класифікації, що показує, що мемрістор LSTM - це перспективна апаратна платформа з низьким енергоспоживанням та низькою затримкою для виведення краю.

Параметри доступу

Підпишіться на журнал

Отримайте повний доступ до журналу протягом 1 року

всього 7,71 € за випуск

Усі ціни вказані у нетто-цінах.
ПДВ буде додано пізніше під час оплати.

Оренда або купівля статті

Отримайте обмежений за часом або повний доступ до статей на ReadCube.

Усі ціни вказані у нетто-цінах.

Наявність даних

Дані, що підтверджують сюжети в цій роботі, та інші висновки цього дослідження доступні у відповідного автора за обґрунтованим запитом. Код, який підтримує сюжети в цій статті та інші результати цього дослідження, доступний за адресою http://github.com/lican81/memNN. Код, що підтримує зв'язок між спеціально створеною системою вимірювань та інтегрованою мікросхемою, можна отримати у відповідного автора за розумним запитом.

Список літератури

LeCun, Y., Bengio, Y. & Hinton, G. Глибоке навчання. Природа 521, 436–444 (2015).

Hochreiter, S. & Schmidhuber, J. Довга короткочасна пам'ять. Нейронні обчислення. 9, 1735–1780 (1997).

Герс, Ф. А., Шмідхубер, Дж. І Каммінс, Ф. Вчимося забувати: постійне передбачення за допомогою LSTM. Нейронні обчислення. 12, 2451–2471 (2000).

Schmidhuber, J., Wierstra, D. & Gomez, F. Evolino: гібридна нейроеволюція/оптимальна лінійна. В Proc 19-а міжнародна спільна конференція зі штучного інтелекту 853–858 (Морган Кауфманн, Сан-Франциско, 2005).

Бао, В., Юе, Дж. & Рао, Ю. Поглиблене навчання для фінансових часових рядів із використанням накопичених автокодерів та довгострокової пам'яті. PLOS ONE 12, e0180944 (2017).

Jia, R. & Liang, P. Рекомбінація даних для нейронного семантичного синтаксичного аналізу. В Proc. 54-та щорічна зустріч Асоціації обчислювальної лінгвістики (ред. Ерк, К. та Сміт, Н. А.) 12–22 (Асоціація обчислювальної лінгвістики, 2016).

Карпаті, А. Нерозумна ефективність періодичних нейронних мереж. Блог Андрія Карпаті http://karpathy.github.io/2015/05/21/rnn-effectiveness/ (2015).

Ву, Ю. та ін. Система нейронного машинного перекладу Google: подолання розриву між людським та машинним перекладом. Препринт на https://arxiv.org/abs/1609.08144 (2016).

Xiong, W. та співавт. Система розпізнавання розмовного мовлення Microsoft 2017. В 2018 Міжнародна конференція IEEE з акустики, обробки мови та обробки сигналів (ICASSP) 5934–5938 (IEEE, 2018).

Судхакаран, С. та Ланц, О. Навчання виявляти насильницькі відео за допомогою звивистої довгої короткочасної пам'яті. В Proc. 14-а Міжнародна конференція IEEE з удосконаленого відеоспостереження та спостереження на основі сигналів (AVSS) 1–6 (IEEE, 2017).

Чанг, А. X. М. & Culurciello, E. Апаратні прискорювачі для періодичних нейронних мереж на ПЛІС. В Proc 2017 IEEE Міжнародний симпозіум про схеми та системи 1–4 (IEEE, 2017).

Гуан, Ю., Юань, З., Сонце, Г. і Конг, Дж. Прискорювач на основі FPGA для тривалої короткострокової пам'яті, що оновлює нейронні мережі. В Proc. 2017 22-а конференція з автоматизації дизайну в Азії та Південному Тихому океані 629–634 (IEEE, 2017).

Чжан Ю. та ін. Енергоефективний прискорювач на основі FPGA для мережі LSTM. В Proc. 2017 Міжнародна конференція IEEE з кластерних обчислень 629–630 (IEEE, 2017).

Конті, Ф., Кавігеллі, Л., Паулін, Г., Сусмель, І. та Беніні, Л. Бурундук: систолічно масштабований 0,9 мм 2, 3,08 гоп/с/мВт при 1,2 мВт прискорювача нейронної мережі біля сенсора умовивід. В 2018 Конференція IEEE щодо інтегрованих мікросхем (CICC) 1–4 (IEEE, 2018).

Різакіс, М., Веньєріс, С. І., Куріс, А. і Буганіс, К.-С. Орієнтовні LSTM на основі FPGA при обмеженнях часу обчислення. В 14-й Міжнародний симпозіум з прикладних реконфігурованих обчислень (ARC) (під ред. Вороса, Н. та ін.) 3–15 (Springer, Cham, 2018).

Чуа, Л. Мемрістор - відсутній елемент ланцюга. IEEE Trans. Теорія ланцюгів 18, 507–519 (1971).

Струков, Д. Б., Снайдер, Г. С., Стюарт, Д. Р. і Вільямс, Р. С. Зниклий мемристор знайдений. Природа 453, 80–83 (2008).

Ян, Дж. Дж., Струков, Д. Б. і Стюарт, Д. Р. Мемрістивні пристрої для обчислень. Нат. Нанотех. 8, 13–24 (2013).

Li, C. та співавт. Обробка аналогового сигналу та зображення за допомогою великих мемристорних ригелів. Нат. Електрон. 1, 52–59 (2018).

Ле Галло, М. та ін. Змішані точні обчислення в пам’яті. Нат. Електрон. 1, 246–253 (2018).

Преціозо, М. та співавт. Навчання та функціонування інтегрованої нейроморфної мережі на основі металоксидних мемристорів. Природа 521, 61–64 (2015).

Берр, Г. В. та ін. Експериментальна демонстрація та толерантність широкомасштабної нейронної мережі (165 000 синапсів) з використанням пам'яті фазового зміни як синаптичного вагового елемента. IEEE Trans. Електрон. Пристрої 62, 3498–3507 (2015).

Ю, С. та ін. Двійкова нейронна мережа з макрочипом rram 16 мб для класифікації та онлайн-тренінгу. В 2016 Міжнародна зустріч електронних пристроїв IEEE (IEDM) 16.2.1–16.2.4 (IEEE, 2016).

Яо, П. та ін. Класифікація обличчя за допомогою електронних синапсів. Нат. Комун. 8, 15199 (2017).

Ху, М. та співавт. Аналогові обчислення на основі Мемрістора та класифікація нейронних мереж із механізмом крапкових продуктів. Адв. Матер. 30, 1705914 (2018).

Li, C. та співавт. Ефективне та самоадаптивне навчання in-situ у багатошарових мемристорних нейронних мережах. Нат. Комун. 9, 2385 (2018).

Xu, X. та ін. Масштабування для виведення краю глибоких нейронних мереж. Нат. Електрон. 1, 216–222 (2018).

Jeong, D. S. & Hwang, C. S. Енергонезалежні матеріали пам'яті для нейроморфних інтелектуальних машин. Адв. Матер. 30, 1704729 (2018).

Du, C. та співавт. Обчислення пласта з використанням динамічного мемристора для тимчасової обробки інформації. Нат. Комун. 8, 2204 (2017).

Смагулова, К., Крестінська, О. та Джеймс, А. П. Схема довготривалої короткочасної пам'яті на основі мемристора. Аналоговий. Інтегр. Коло Сиг. Процес 95, 467–472 (2018).

Цзян Х. та ін. Канал Ta до 10 нм, відповідальний за чудові характеристики мемристора HfO2. Наук. Респ. 6, 28525 (2016).

Yi, W. та ін. Квантована провідність збігається з нестабільністю стану та надлишковим шумом у мемристорах оксиду танталу. Нат. Комун. 7, 11142 (2016).

Румелхарт, Д. Е., Хінтон, Г. Е. та Вільямс, Р. Дж. Навчальні уявлення шляхом помилок, що поширюються назад. Природа 323, 533–536 (1986).

Мозер, М. С. Фокусований алгоритм зворотного розповсюдження для розпізнавання часового візерунка. Комплекс Сист. 3, 349–381 (1989).

Вербос, П. Дж. Узагальнення зворотного поширення із застосуванням до періодичної моделі ринку газу. Нейронна мережа. 1, 339–356 (1988).

Шоллет, Ф. Керас: бібліотека глибокого навчання для Теано та тензорного потоку. Керас https://keras.io (2015).

Філліпс, П. Дж., Саркар, С., Робледо, І., Гротер, П. та Бойєр, К. Проблема ідентифікації ходи: набори даних та базовий алгоритм. В Proc. 16-а міжнародна конференція з розпізнавання зразків Вип. 1, 385–388 (IEEE, 2002).

Кале, А. та ін. Ідентифікація людей за допомогою ходи. IEEE Trans. Процес зображення. 13, 1163–1173 (2004).

Tieleman, T. & Hinton, G. Лекція 6.5 - RMSprop: розділіть градієнт на середнє значення для його останньої величини. КУРСЕР: Neural Netw. Мах. Навчіться. 4, 26–31 (2012).

Чой, С. та співавт. Епітаксійна пам’ять SiGe для нейроморфних обчислень з відтворюваною високою продуктивністю на основі інженерних дислокацій. Нат. Матер. 17, 335–340 (2018).

Бурт, Ю. та ін. Енергетичний органічний електрохімічний пристрій як низьковольтний штучний синапс для нейроморфних обчислень. Нат. Матер. 16, 414–418 (2017).

Амброджо, С. та ін. Прискорене навчання нейронних мереж з еквівалентною точністю з використанням аналогової пам'яті. Природа 558, 60–67 (2018).

Шерідан, П. М., Цай, Ф., Ду, С., Чжан, З. і Лу, В. Д. Розріджене кодування мемристорними мережами. Нат. Нанотех. 12, 784–789 (2017).

Шафі, А. та ін. ISAAC: згортковий нейронний мережевий прискорювач з аналоговою арифметикою in situ на поперечинах. В Proc. 43-й Міжнародний симпозіум з комп'ютерної архітектури 14–26 (IEEE, 2016).

Гокмен, Т. та Власов, Ю. Прискорення навчання глибоких нейронних мереж резистивними перехресними пристроями: міркування щодо проектування. Спереду. Невроски. 10, 33 (2016).

Cheng, M. та співавт. TIME: архітектура навчання в пам'яті для глибоких нейронних мереж на основі мемрістора. В Proc. 54-та щорічна конференція з автоматизації проектування 26 (ACM, 2017).

Song, L., Qian, X., Li, H. & Chen, Y. PipeLayer: конвеєрний прискорювач на основі ReRAM для глибокого навчання. В 2017 Міжнародний симпозіум IEEE з архітектури високопродуктивних комп’ютерів 541–552 (IEEE, 2017).

Подяка

Ця робота була підтримана частково Дослідницькою лабораторією ВПС США (грант № FA8750-15-2-0044) та Управлінням розвідних дослідницьких проектів (IARPA; контракт № 2014-14080800008). D.B., студент коледжу Swarthmore, отримав підтримку дослідницького досвіду NSF для студентів (грант № ECCS-1253073) в Університеті Массачусетсу. П.Й. відвідував Університет науки і технологій Хуачжун за підтримки Китайської стипендіальної ради (грант № 201606160074). Частина виготовлення пристрою проводилася в чистій кімнаті Центру ієрархічного виробництва, Наномасштабного науково-технічного центру NSF, розташованого в Університеті Массачусетсу Амхерст.

Інформація про автора

Поточна адреса: Hewlett Packard Labs, Пало-Альто, Каліфорнія, США

Приналежності

Кафедра електротехніки та обчислювальної техніки Університету Массачусетсу, Амхерст, Массачусетс, США

Can Li, Zhongrui Wang, Mingyi Rao, Daniel Daniel, Wenhao Song, Hao Jiang, Peng Yan, Yunning Li, Peng Lin, J. Joshua Yang & Qiangfei Xia

Лабораторії Hewlett Packard, Пало-Альто, Каліфорнія, США

Мяо Ху, Джон Пол Страчан та Р. Стенлі Вільямс

HP Labs, HP Inc., Пало-Альто, Каліфорнія, США

Лабораторія досліджень ВПС, Інформаційне управління, Рим, Нью-Йорк, США

Марк Барнелл і Цін Ву

Ви також можете шукати цього автора в PubMed Google Scholar

Внески

Q.X. та C.L. задумав ідею. Q.X., J.J.Y. та C.L. розробив експерименти. C.L., Z.W. та Д.Б. здійснюється програмування, вимірювання, аналіз даних та моделювання. M.R., P.Y., C.L., H.J., N.G. та П.Л. побудовані інтегровані мікросхеми. Y.L., C.L., W.S., M.H., Z.W. та J.P.S. побудував вимірювальну систему та прошивку. Q.X., C.L., J.J.Y. та Р.С.В. написав рукопис. M.B., Q.W. а всі інші автори брали участь в аналізі результатів та коментували рукопис.

Автори-кореспонденти

Декларації про етику

Конкуруючі інтереси

Автори декларують відсутність конкуруючих інтересів.

Додаткова інформація

Примітка видавця: Springer Nature залишається нейтральним щодо юрисдикційних вимог в опублікованих картах та інституційних приналежностей.

Додаткова інформація

Рисунки, примітки та посилання

Права та дозволи

Про цю статтю

Цитуйте цю статтю

Лі, К., Ван, З., Рао, М. та ін. Довгострокові мережі короткочасної пам'яті в поперечних масивах мемристора. Нат Мах Інтелл 1, 49–57 (2019). https://doi.org/10.1038/s42256-018-0001-4

Отримано: 30 травня 2018 р

Прийнято: 02 жовтня 2018 року

Опубліковано: 07 січня 2019 року

Дата випуску: січень 2019 р

Подальше читання

Необхідні умови для вивчення розпізнавання образів на основі STDP у запам'ятовувальній нейронній мережі

В.А. Дьомін
, Д.В. Нехаєв
, І.А. Суражевський
, К.Е. Нікіруй
, А.В. Ємельянов
, С.Н. Миколаїв
, В.В. Рилковим
& M.V. Ковальчук

Нейронні мережі (2021)

Асоціативне STDP-подібне вивчення нейроморфних ланцюгів на основі поліанілінових пам’ятних мікроприладів

Микита В Прудников
, Дмитро А Лапкін
, Андрій В Ємельянов
, Антон А Міннеханов
, Юлія Н Малахова
, Сергій Н Чвалун
, В’ячеслав А Демін
& Віктор V Єрохін

Журнал фізики D: Прикладна фізика (2020)