Учёные создали ИИ, способный переводить мысли человека в текст
- Семиднeвная Панорама
Исследователи разработали искусственный интеллект (ИИ), способный превращать сигналы мозга в текст, не прибегая к хирургическому вмешательству. Новый метод под названием «ментальные субтитры» создаёт точные описания того, что человек видит или представляет, и может стать прорывом для людей, утративших способность говорить, сообщает издание «Наука».
Учёные представили новый искусственный интеллект, который способен превращать мозговую активность в текст, не требуя имплантации электродов. Технология, получившая название «ментальные субтитры», создаёт описания того, что человек видит или представляет себе, основываясь исключительно на активности его мозга.
Главное отличие этой системы в том, что она распознаёт образы ещё до того, как мозг превращает мысли в слова. Разработка может стать прорывом для людей с нарушениями речи, например, перенёсших инсульт.
Модель предсказывает, на что смотрит человек, с удивительной точностью и детализацией. «Это сложная задача. Удивительно, что можно получить так много деталей» — отметил вычислительный нейробиолог Алекс Хут из Калифорнийского университета в Беркли.
Как работает «переводчик мыслей»
Учёные уже более 10 лет способны определять, что человек видит или слышит, анализируя активность его мозга. Но распознавание более сложных образов, например коротких видеосюжетов, до сих пор оставалось трудной задачей.
Ранее существующие модели могли лишь распознать отдельные ключевые слова, но не передавали контекста — действий, эмоций или смысла происходящего. Как пояснил нейробиолог Томоясу Хорикава из Японии, «попытки использовали модели искусственного интеллекта, которые сами составляют структуру предложения, что затрудняет понимание, было ли это описание действительно представлено в мозгу».
Метод Хорикавы построен иначе: глубокая языковая модель проанализировала текстовые описания более чем двух тысяч видеороликов, превращая каждое из них в числовую «смысловую сигнатуру». Затем другой ИИ обучили на сканах мозга шести участников — он находил закономерности активности, соответствующие этим сигнатурам.
После обучения «декодер» смог распознавать новые сканы мозга и предсказывать, какой сюжет человек видит. На основе этой информации другой ИИ создавал текстовое описание.
Например, когда испытуемый смотрел видео, где человек прыгает с вершины водопада, система сначала предположила фразу «весенний поток», затем — «над стремительно льющимся водопадом», а спустя сотню итераций сформировала точное описание: «человек прыгает через глубокий водопад на горном хребте».
Эксперимент также показал, что ИИ может описывать воспоминания участников — когда те вспоминали видеоролики, система формировала сходные описания. Это подтверждает, что мозг использует похожие механизмы для восприятия и памяти.
Возможности и риски
Методика основана на неинвазивной функциональной магнитно-резонансной томографии (фМРТ). Учёные надеются, что со временем технология поможет совершенствовать интерфейсы «мозг-компьютер» для людей, утративших способность говорить.
«Если мы сможем сделать это с помощью таких искусственных систем, возможно, у нас получится помочь людям с трудностями в общении», — отметил Хут. Ранее, в 2023 году, он со своими коллегами создал похожую модель, способную расшифровывать язык по сигналам мозга без операции.
Однако, добавил учёный, такие разработки вызывают вопросы о конфиденциальности, ведь они приближают науку к возможности расшифровки мыслей и эмоций. Теоретически, подобные технологии могут быть использованы для слежки или манипуляций. Но пока это невозможно: все исследования проводятся только с согласия участников, а модели не способны распознавать личные мысли.
Оксана Андрущак
Читайте также:
