Шаг к чтению мыслей. Искусственный интеллект Meta может преобразовывать данные сканирования мозга в связные предложения
Компания Meta представила Brain2Qwerty v2 — свою последнюю попытку преобразовать шумовую мозговую активность в связный текст: это можно представить как рудиментарную форму алгоритмически опосредованного чтения мыслей.
Система Brain2Qwerty v2 компании может преобразовывать сканирование мозга в связные предложения без необходимости инвазивного хирургического вмешательства, пишет Gizmodo.
Хотя исследование все еще находится на ранних стадиях, оно даёт представление о, возможно, не столь уж отдаленном будущем, в котором пациенты, страдающие анартрией, синдромом замкнутого мозга, боковым амиотрофическим склерозом (БАС) и другими парализующими нейродегенеративными расстройствами, смогут общаться с помощью мыслей без необходимости нейропротезирования, которое обычно требует чрезвычайно инвазивной, сложной и дорогостоящей операции на головном мозге.
«Мы считаем, что это исследование имеет потенциал для реального улучшения жизни миллионов людей, страдающих от поражений мозга, мешающих им общаться», — написали инженеры Meta. Исходный код Brain2Qwerty v2, а также код его предшественника, v1, был опубликован в Интернете.
«Мы надеемся, что эта работа, выполненная в открытом режиме, будет способствовать развитию нейронауки для более быстрого выявления, диагностики и лечения неврологических расстройств, чем в изолированном режиме», — написала компания, отражая растущую тенденцию в индустрии искусственного интеллекта, направленную на предоставление учёным доступа к ИИ с открытым исходным кодом во имя ускорения темпов научных открытий.
Обучение новой модели, которое проводилось в Баскском центре познания, мозга и языка в Сан-Себастьяне, Испания, включало девять здоровых добровольцев в возрасте от 25 до 56 лет, которых попросили набрать более 2500 предложений в течение десяти сеансов. В ходе этих сеансов их мозговая активность контролировалась с помощью магнитоэнцефалографии (МЭГ), которая измеряет микроскопические электрические поля, образующиеся в результате нейронной активности. Все эти набранные предложения и сканирования мозга затем послужили необработанными обучающими данными, которые были загружены в Brain2Qwerty.
В своём самом успешном эксперименте Brain2Qwerty v2 достиг точности распознавания слов на уровне 78% — это означает, что более половины предложений, расшифрованных на основе активности мозга, содержали не более одной ошибки в слове. В свою очередь, Brain2Qwerty v1 (выпущенный в прошлом году) в своем самом успешном случае достиг результата 48%.
Исследователи также обнаружили, что точность декодирования новой системы росла вместе с объемом обучающих данных, которые ей предоставлялись, что свидетельствует о том, что простые законы масштабирования можно применять для создания более мощных систем в будущем: «если длительное обучение на неинвазивных данных МЭГ в конечном итоге устранит необходимость нейрохирургического вмешательства в этих случаях», — написали исследователи в своей технической статье, — «это будет означать трансформационный сдвиг в уходе за пациентами».
Беспрецедентная точность декодирования Brain2Qwerty v2 была достигнута в значительной степени благодаря использованию той же технологии распознавания образов, что и в чат-ботах, таких как ChatGPT и Llama от Meta. На первых двух этапах процесса декодирования мозговые волны испытуемых, измеренные с помощью MEG, преобразовывались с помощью искусственного интеллекта в токены, представляющие отдельные символы, после чего другая система искусственного интеллекта, называемая выравнивателем, упорядочивала отдельные символы в полные слова. Далее работу берет на себя большая языковая модель, преобразуя набор символов и слов, полученных от другой системы искусственного интеллекта, в связные предложения.
Эти результаты знаменуют собой первый случай успешного применения метода LLM для преобразования шумовой мозговой активности в структурированные, понятные предложения. Это также может предложить ценную новую модель для будущих исследователей, стремящихся создать новые интерфейсы «мозг-машина», физические или виртуальные, в которых несколько систем искусственного интеллекта используются для декодирования мозговой активности иерархическим и кооперативным образом.
Ранее NV Техно писало, что американская компания Neurable недавно объявила о лицензировании своей технологии считывания мозговой активности для создания потребительских устройств. В отличие от основанного Илоном Маском стартапа Neuralink, который имплантирует чипы BCI (интерфейс «мозг-компьютер») прямо в череп, разработка конкурентов не требует хирургического вмешательства.
В свою очередь, технология Neurable работает благодаря ЭЭГ-датчикам, которые сканируют активность мозга. Затем искусственный интеллект анализирует эти данные, чтобы показать, насколько человек сосредоточен, расслаблен или уставший в конкретный момент.
