Новая реальность: цифровые двойники и искусственный интеллект

В эпоху становления цифровой экономики традиционные представления о числах и данных существенно изменились. Возникла даже целая отрасль науки о больших данных (Data Science). О новых понятиях и тенденциях в этой науке, а также о ее связи с искусственным интеллектом и о роли научно-исследовательской лаборатории искусственного интеллекта в их развитии рассказала заместитель заведующего НИЛ ИИ ПГУТИ Оксана Захарова.

Большие числа - большие проблемы

Формального определения больших данных не существует. Более 60 лет назад один из крупнейших математиков ХХ века Андрей Колмогоров объяснил научному сообществу, что такое маленькие, средние и большие числа.

Вот один пример того, как появляются большие данные (Big Data). К электрической лампочке присоединены три выключателя, каждый из которых может находиться в левом или в правом положении. Существует восемь возможных вариантов совместных положений выключателей. Проводку к ним можно подвести таким образом, чтобы в каждом из восьми положений лампочка или горела, или не горела. Получится 256 возможных комбинаций. Если выключателей, допустим, пять, комбинаций будет уже 4 294 967 296. А если шесть, то число комбинаций превысит количество атомов во Вселенной.

А теперь представим, что на одну из лекций пришла тысяча человек, и лектор решил с каждым из них поздороваться за руку. При личном контакте он получит информацию о человеке (пол, примерный возраст, рост и т.д.), на основе которой можно определить, например, процентное соотношение мужчин и женщин, их средний возраст (в науке о данных это называется "разметка данных"). Если же попросить всю тысячу присутствующих обменяться рукопожатиями друг с другом, то нашему мозгу не под силу будет сосчитать общее число контактов и тем более обработать в разы увеличившееся количество сведений. Получается, тысяча - это среднее число, потому что мы осознанно не можем проанализировать такое количество элементов.

Сверхсущность или обычная ЭВМ?

Человеческий мозг с легкостью может строить теории, делать выводы и принимать решения при малом наборе сведений. А вот большие объемы данных, и даже средние, люди уже не в силах проанализировать. Для этого и создан искусственный интеллект, который формально определяют как набор методов, алгоритмов, сред и технологий для обработки данных любого типа.

Цель обработки - составление всевозможных прогнозов, разработка классификаций, выявление аномалий, а также получение нового знания, обнаружение новых интересных закономерностей в данных. И компьютер с этим справится гораздо лучше человека. Но все же надо помнить, что у машины всегда есть вероятность погрешности, пусть и минимальной. Поэтому слепо доверять ей не стоит.

Все мы знаем о существовании "трех китов" информатики: это данные, информация и знания. "Сырые" данные мы превращаем в информацию. А из нее, в свою очередь, извлекаем знания - неизвестные ранее сведения. С позиции искусственного интеллекта, информация - структурированные данные. А знания - структурированная информация. Сейчас ученые работают над автоматизацией процессов структуризации.

Однако популярность термина "искусственный интеллект" во многом объясняется его ошибочным толкованием, в частности, когда им обозначают некую искусственную сущность, наделенную разумом, которая якобы в состоянии конкурировать с людьми. Эта мысль из области древних легенд и преданий, звучащая как миф о Големе, с недавних пор реанимируется такими нашими современниками, как британский физик Стивен Хокинг (1942-2018 гг.), американский предприниматель Илон Маск и американский инженер Рэй Курцвейл, а также сторонниками создания так называемого сильного или общего ИИ.

Не будем, впрочем, говорить о данном понимании этого термина, ибо оно скорее представляет собой появившийся под влиянием научной фантастики продукт богатого воображения, а не осязаемую научную реальность, подтвержденную опытами и эмпирическими наблюдениями.

Сплели нейронные сети

Если говорить об ИИ, нельзя не упомянуть такое популярное в наше время понятие, как нейронные сети. Нейронные сети были придуманы лет 60 назад. Сегодня они стали основным инструментом глубокого обучения (Deep Learning) - методов машинного обучения, основанных на имитации работы человеческого мозга в процессе обработки данных.

Мы знаем, что в нашем мозге есть нейроны (нервные клетки), соединенные друг с другом аксонами (длинными цилиндрическими отростками нервной клетки). А с точки зрения информатики нейронная сеть - это математическая модель, в которой искусственные нейроны (простые процессоры) объединены в систему и взаимодействуют друг с другом. Так, каждый процессор периодически получает сигналы от других процессоров, а также посылает сигналы сам. И такая с виду простая сеть способна выполнять довольно сложные задачи.

Схема работы нейросети выглядит так: входные нейроны получают исходные данные, скрытые нейроны обрабатывают информацию, а выходные нейроны выводят готовый результат. Таким образом, в зависимости от характера задачи определенное количество нейронов получает входные данные, а затем передает их на скрытый средний слой. Машина ищет закономерности среди огромного количества нейронных связей и "принимает" решение.

От физического тела - к цифровому двойнику

А что потом? Data Science уже начала менять наш мир. Мы никуда не денемся от цифровизации. Окружающие нас вещи будут постепенно лишаться физического тела и переходить в виртуальность под лозунгом: "Все, что может быть лишено физического тела, будет его лишено, превратившись в цифрового двойника".

Можно предположить, что в недалеком будущем после полной цифровизации геномов белковых тел станет вероятным отправлять их цифровую копию по электронной почте. Кстати, уже сейчас наблюдается тенденция падения спроса на программистов, стали востребованы другие специалисты - компьютерные лингвисты, специалисты по машинному обучению, архитекторы виртуальности, аналитики Big Data. Особенно этот процесс будет ускоряться в связи с появлением ChatGPT.

ПГУТИ создает кадры для цифровой экономики будущего

В России в последние два года сделан серьезный шаг вперед, совершен скачок и на уровне регионов, и на уровне правительства для того, чтобы создать условия для развития искусственного интеллекта практически во всех сферах. Сегодня явно виден рост интереса к развитию и внедрению технологии искусственного интеллекта.

Поволжский государственный университет телекоммуникаций и информатики является одним из первых образовательных учреждений региона, которое оценило перспективы развития данных технологий.

В январе 2020 года в ПГУТИ была создана Научно-исследовательская лаборатория искусственного интеллекта (НИЛ ИИ). Возглавил ее Сергей Левашкин, выпускник МГУ им. М.В.Ломоносова, ученый с более чем 20-летним опытом работы в университетах и компаниях России, Северной Америки и Европы.

В контексте национальной программы "Цифровая экономика РФ" и "Плана 2030", создание НИЛ ИИ является стратегическим проектом, поскольку наука о данных, искусственный интеллект и бизнес-интеллект являются ключевыми факторами цифровой трансформации экономики.

Сегодня лаборатория занимает лидирующее положение в НИР и НИОКР университета по ИИ и решает самые разнообразные задачи, включая научно-исследовательскую работу в области науки о данных, искусственного интеллекта и машинного обучения, а также подготовку высококвалифицированных кадров для цифровой экономики.

Искусственный интеллект хорошо работает в интересах и на благо людей, если его создает и применяет грамотный, хорошо подготовленный человек.

Лаборатория обеспечивает содержанием факультатив и магистерскую программу "Наука о данных и искусственный интеллект", а также коммерческий курс "Бизнес-интеллект".

Студенческий курс содержит популярное введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Он мотивирует студентов старших курсов на поступление в магистратуру "Наука о данных и искусственный интеллект", но доступен также студентам младших курсов и самой широкой публике.

Коммерческий курс - введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Курс рассчитан на повышение цифровой грамотности управленцев, представителей коммерческих компаний и т.д. Содержит примеры приложений методов искусственного интеллекта в различных областях экономики, бизнеса, управления и т.д.

В 2022 году на базе НИЛ ИИ ПГУТИ впервые был осуществлен прием в магистратуру по профилю "Прикладной искусственный интеллект и наука о данных" по программе МГУ.

В рамках реализации программы осуществляется подготовка специалистов в области искусственного интеллекта и науки о данных, способных применять фундаментальные знания математических и естественных наук, программирования и информационных технологий при решении прикладных задач различного уровня сложности с целью удовлетворения потребностей промышленности, бизнеса и науки, муниципального и государственного управления, решения иных задач.

Активно ведется студенческая научная работа. Студенты и магистранты уже с самых ранних курсов обучения имеют возможность работать над реальными практическими задачами, осваивать новые компетенции в области искусственного интеллекта и науки о данных, принимая участие в научной и грантовой деятельности лаборатории.

Лаборатория активно ведет НИР и выигрывает различные гранты - от математического моделирования распространения вирусных заболеваний до разработки модулей для системы "Умные дороги".

Кроме того, лаборатория НИЛ ИИ входит в состав Рабочего комитета "Искусственный интеллект" НОЦ "Инженерия будущего" - это научно-образовательный центр, объединяющий науку и реальный сектор экономики. Основным направлением от ПГУТИ в области искусственного интеллекта является разработка инфокоммуникационных технологий на основе анализа BigData. Куратор направления - заведующий лабораторией Сергей Левашкин.

В горизонте текущего десятилетия задача лаборатории - обеспечить массовое внедрение искусственного интеллекта. Оно должно охватить все отрасли экономики, социальной сферы и систему госуправления.

Научный поиск НИЛ ИИ ПГУТИ

  • Программное обеспечение формализации и извлечения знаний о сложных информационных объектах
  • Алгоритмы и программное обеспечение машинного обучения (machine learning)
  • Аналитическое программное обеспечение нового поколения (next-generation analytics)
  • Мультиязычные (инвариантные к исходным языкам) и мультимодальные (инвариантные к типу контента) системы извлечения и формализации информации (nlp)
  • Алгоритмы и программное обеспечение для формализации и извлечения знаний из слабоструктурированной и неструктурированной информации.
  • Математические модели распространения вирусных заболеваний и их исследование методами искусственного интеллекта
  • Семантико-ассоциативный анализ и синтез телекоммуникационных данных

Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ

Реализованные гранты НИЛ ИИ ПГУТИ (2022 год)

  • "Вирусы I": Многофакторное моделирование с применением технологий искусственного интеллекта структурно-динамического равновесия социально-экономической системы РФ при распространении пандемии (РФФИ/РНФ)
  • "Вирусы II": Математическое моделирование распространения вирусных заболеваний (Минобраз/РосАтом)
  • "Умные дороги": Разработка модуля интеллектуальной обработки данных системы мониторинга оптоволоконных сигналов (Haulmont).
  • "СМАРТ продукты": Применение алгоритмов ИИ для компьютерного моделирования новых продуктов, товаров и услуг с заданными свойствами (Минцифры РФ).

Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ

Ссылки: https://ai.psuti.ru/

https://t.me/laboratoria_psuti

https://vk.com/nil_ai_psuti

Автор выражает благодарность за помощь в подготовке статьи заведующему НИЛ ИИ Сергею Павловичу Левашкину.

Туристский информационный центр решил выяснить, что жители Самарской области думают о туристической привлекательности нашего региона. Приглашаем к участию в опросе.

Что поможет привлекать гораздо больше туристов в Самарскую область?

архив опросов

Последние комментарии

Артур Пирожков 27 мая 2022 05:13 Как на время отпуска приостановить договор с оператором

на х..вы нужны что б к вам ходить в в абон отдел..вы что наше время считаете затраченное в ваших отделах пшиком!!!легче просто не платить..на крайний случай послать..и подключить другого оператора..благо вас сидячих на жопах и стремящих ободрать народ стало как го....слово..специалист..меня убивает!!!особено специалисты операторы!!!эх вас бы ..к на производство...чтоб вы поняли что 600 р это деньги заработанные трудом...а не перепродажей трафика сидя на жопах!

Walerii Trofimov 09 октября 2018 10:54 Коллективные ТВ-антенны станут обязательными

Услуга только добровольная. Это рекламное навязывание

Фото на сайте

Все фотогалереи

Новости раздела

Все новости
Архив
Пн Вт Ср Чт Пт Сб Вс
24 25 26 27 28 29 30
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 1 2 3 4