Официальное название проекта — FEDOR (Final Experimental Demonstration Object Research). Рабочим названием в самом начале был «Аватар». Имя проекту дал Дмитрий Рогозин.
Этот проект реализует Фонд перспективных исследований совместно с НПО «Андроидная техника» по заказу МЧС России. Цель — разработать систему комбинированного управления антропоморфным робототехническим комплексом при выполнении спасательных операций.
НПО — не новичок в робототехнике. Существует эта организация уже 13 лет, за время своей работы НПО выпустило 50 роботов для частных компаний и государственных организаций. Среди заказчиков и партнеров — Минпромторг, ФСБ, МЧС, Министерство здравоохранения, Центр подготовки космонавтов им. Гагарина, Российское атомное сообщество, ракетно-космическая корпорация (РКК) «Энергия» и другие. НПО получает деньги как от частных, так и государственных заказчиков. Годовой бюджет составляет около 500 млн руб.
Работы по созданию системы начались в 2014 году и продолжаются до сих пор. Впервые публиковать информацию о Федоре стали в 2016 году.
Физически центр разработки располагается в Магнитогорске, в деловом центре «Альфа Центр» и нескольких лабораториях в том же городе.
Федор создается с нуля?
Не совсем. Основа — предыдущие модели робототехнических устройств, созданных НПО «Андроидная техника» по заказу Роскосмоса. Речь идет о моделях SAR-400 и SAR-401. Роскосмосу был нужен электронно-механический помощник для космонавтов, работающих на МКС.
Разработка проводится в два этапа. Первый — опытно конструкторские работы. На этом этапе разработчики создали пять технологических макетов для отработки программного обеспечения.
Два макета выглядели как полноценные роботы, а у трех остальных не хватало нескольких элементов — например, верхней или нижней части. В самом начале специалисты хотели использовать гидравлический привод, но оказалось, что цена слишком высокая, а надежность такой системы низкая. Поэтому от гидравлики отказались в пользу электропривода.
Сколько стоит проект?
Разработчики потратили около 300 млн рублей, но до завершения проекта еще далеко, так что это не полная сумма. Какие характеристики у робота?
Его рост — 180 см,
Вес — около 160 кг.
Мощность — 13,5 кВт (20 лошадиных сил). Робот состоит из 15 тысяч деталей. Программное обеспечение — операционная система реального времени, разработанная в Санкт-Петербурге на базе Linux. Работа в автономном режиме — 1 час, заряжается он через обычную розетку.
Робот — полностью отечественная разработка?
Точной информации о процентном соотношении отечественных и иностранных компонентов для всех прототипов робота нет. Тем не менее, известно, что для одного из них 50% деталей изготавливались в России, остальные — по спецзаказу собираются в Японии, Германии, США, Швейцарии и других странах. Программное обеспечение для робота разработано на базе Linux, так что его тоже сложно назвать исключительно российским.
90% электронных компонентов для робота производят в России разные организации, включая предприятия «Абрис-Технолоджи» и Silicium из Санкт-Петербурга.
Федором управляет оператор?
Первые прототипы работали исключительно под управлением оператора. Сейчас стало известно, что Федор уже научился действовать автономно, причем это самообучающаяся система. Информацию об окружающей среде и ее параметрах робот получает от самых разных датчиков:
двух камер;
тепловизора;
микрофона;
GPS и ГЛОНАСС;
15 дальномерных лазеров;
специальной системы для определения положения своего тела.
Федор умеет идентифицировать типовые объекты и инструменты и различает препятствия. Все это он сводит в трехмерную схему окружающей обстановки. На данный момент он умеет открывать дверь, использовать дрель, стрелять из пистолета, водить автомобиль и квадроцикл в автономном режиме. В будущем разработчики планируют обучить робота самостоятельно определять задачу. Например, если Федор увидит пострадавшего во время землетрясения, чья нога придавлена бетонным блоком, он «поймет», что для освобождения человека нужно убрать блок и отнести пострадавшего в безопасное место.
Кроме того, робот может действовать и в копирующем режиме. В этом случае оператор надевает экзоскелет, повторяющий структурные особенности Федора. Ну а робот копирует движения оператора. Можно посмотреть как Федор стреляет. Насколько можно понять, стрельба с двух рук выполнялась под контролем оператора.
Оператор может находиться от робота в тысячах километров, передача телеметрии осуществляется по спутниковой связи. Управлять роботом оператор может и в супервизорном режиме — не задавая движения при помощи экзоскелета, а показывать, что нужно сделать, на экране.
Разработчики говорят, что оператором может быть врач, военный, спасатель или любой другой специалист. Так что робот при необходимости может выполнять самые разные функции, от изучения зараженного радиацией полигона до проведения строительных работ.
По словам разработчиков, электронно-механическая база Федора ничем не уступает ATLAS, которого разрабатывает агентство DARPA. Но программный комплекс не такой совершенный. В частности, потому, что с ATLAS работают тысячи программистов, а с Федором — только те, кто имеет непосредственное отношение к проекту.
Зачем робота научили стрелять?
Разработчики утверждают, что это сделано лишь для демонстрации возможностей системы. Для решения таких задач, как прицеливание, выбор цели, умение снизить отдачу и т.п. нужно разработать специализированные алгоритмы, а это многомесячная, если не многолетняя работа. Да и Федор — не военная разработка.
Где Фёдора планируют использовать?
Главная сфера его применения — спасение жизней. Он будет работать на территориях и в зданиях с химическим и радиационным заражением. Сейчас Фонд перспективных исследований вместе с Росатомом создает прототипы, которые смогут заниматься сортировкой радиоактивных отходов. У Федора — хорошая мониторика «рук», так что он в состоянии помогать людям на производстве. Возможно, его научат помогать собирать других роботов.
Хорош он может быть и в саперном деле, в медицине (уже сейчас робот умеет делать уколы и накладывать шины). К сожалению, более-менее тонкие работы выполняются лишь при управлении оператора.
В 2019 году Федора отправляли в полет на космическом корабле «Федерация». Правда, для этого разработчики создали новую версию системы, которая соответствовала всем требованиям ракетно-космической отрасли. Более надежная электроника, емкий аккумулятор, меньшие размеры — все это было реализовано к моменту отправки в 2019 году.
Насколько близко мы подошли к созданию терминатора?
Хладнокровная машина, не знающая печали и жалости. Неумолимо и прямолинейно выполняющая поставленную ей задачу до конца. Таким запомнился зрителю терминатор из одноимённого фильма. Согласно его сценарию, бездушная машина прибыла к нам из будущего. И вот, именно сейчас мы подходим к тому времени, когда в мире из фильма машины берут верх над людьми.
Если обратить свое внимание на техническую сторону этого робота, то то, что удивляло в 1984 году, сейчас кажется чем-то знакомым, и уже маячит на горизонте. На каких же технологиях эти роботы построены там, глубоко внутри своего стального черепа?
Давайте всего на один день предположим, что Джеймс Кэмерон уже в 1984 году что-то знал и снял не фантастический фильм, а попытался послать нам предупреждение. Что если режиссёр фильма попробовал нас оградить от того, к чему может привести злоупотребление новыми технологиями и насколько мы смогли с их помощью приблизиться к созданию таких машин?
Я думаю, что превращение ИИ в оружие — самая большая опасность. Думаю, что мы столкнёмся с ИИ, эквивалентным гонке ядерных вооружений, и если его не создадим мы, то его обязательно создадут другие, и тогда ситуация обострится. Вы можете представить себе ИИ на театре военных действий, где компьютеры сражаются на скорости, за которой больше не успевают люди, и у вас нет возможности деэскалации.
Джеймс Кэмерон
«Превращение ИИ в оружие — самая большая опасность»
Кинорежиссёр Джеймс Кэмерон согласен с экспертами в том, что достижения в области искусственного интеллекта представляют серьёзную опасность для человечества.
Кэмерон, известный по фильмам «Титаник» и «Аватар», был режиссёром и соавтором сценария научно-фантастического боевика 1984 года «Терминатор» о киборге-убийце. На вопрос о том, что он думает по поводу опасений специалистов на тему темпов развития искусственного интеллекта, Кэмерон ответил так: «Я полностью разделяю их озабоченность. Я предупреждал вас, ребята, ещё в 1984 году, а вы не слушали».
Кэмерон сказал, что сегодня важно оценить, кто разрабатывает технологию, и делается ли это для получения выгоды или же для защиты.
Использование ИИ и необходимость в его регулировании также были предметом разногласий в продолжающихся забастовках писателей и актёров в Соединённых Штатах. Актёры требуют защиту от того, чтобы их образы не использовались технологией ИИ без их согласия, а сценаристы выступают против использования ИИ для написания сценариев.
Предлагаю сегодня, провести глубокий и вдумчивый анализ механизмов работы терминатора и вместе найти ответ на этот животрепещущий вопрос.
Нейросети приближают нас к будущему
Люди пытались научить компьютеры разговаривать сразу после их появления. Сейчас даже Алиса, которая звучит почти из каждого телефона, имеет голос, неотличимый от голоса человека.
Все же, для работы умной системы робота одного голоса мало. Надо, чтобы был источник текста, который посылал бы ему то, что нужно произнести. С этой задачей уже справляются нейросети. Такие нейросети, как, например, ChatGPT, YandexGPT, RuGPT и LLAMA поставляют голосовому движку ответы на ваши вопросы, тексты и сказки, ну а голосовой движок, в свою очередь, их озвучивает.
Нейронные сети очень быстро развиваются и, в целом, уже сейчас можно сказать, что те из них, что работают сегодня, своим поведением очень похожи на робота, который сильно похож на человека. C одной стороны, они пишут простые и незамысловатые тексты, не понимают шуток и не могут шутить сами, скудны на эмоции и не всегда правильно отвечают на ваши вопросы, а текст, который они генерируют, такой же сухой и прямолинейный, как и речь этого робота. Ну а с другой... С другой, они пугают своей способностью узнавать ваш голос, распознавать лица, собирать информацию о людях, решать задачи по математике и физике, и даже создавать музыкальные произведения.
Например, последняя версия ChatGPT уже может распознавать образы на изображениях и описывать их. Так распознаёт образы Copilot, бывший Бинг, который использует последнюю версию ChatGPT.
Мир глазами киборга
Давайте теперь посмотрим на мир глазами терминатора. Мы уже прекрасно знаем, как он выглядит. Красный цвет символизирует смещение воспринимаемого роботом диапазона света в инфракрасную зону. В остальном же, интерфейс представлен командной строкой, без графической оболочки – GUI, как, например, в Unix или командная строка в Windows.
На этом интерфейсе выведены командные строки, расположенные в разных частях экрана, каждая из которых представляет собственную часть результата обработки входящей информации. Он похож на текстовый интерфейс современных нейросетей, которые сегодня работают на стационарном компьютере, производя вычисления на процессоре или видеокарте, и без доступа к сети.
Такие текстовые ответы мы все прекрасно видели, это строки текста из результатов, которые выдаёт нейросеть, наподобие Алисы, после обработки ваших промтов. Популярная нейросеть Stable Diffusion тоже работает на дискретной видеокарте внутри компьютера. Перед вами пример интерфейса ещё одной большой языковой модели (Large Language Model, LLM), LLaMA, уже работающей автономно, с использованием ресурсов компьютера.
Посмотрите, система киборга работает точно так же, как и современные языковые модели, через текст. Изображения с камер, расположенных на месте глаз, распознаются и преобразуются в текстовое описание. Например, такая LLM как ChatGPT 4 для того, чтобы объяснить объекты, которые содержатся на фотографиях, делает то же самое.
Отсюда можно предположить, что в ОС Терминатора параллельно работают сразу несколько нейросетей: первая обрабатывает и выводит сообщения о состоянии системы, вторая обрабатывает визуальную информацию, третья LLM отвечает за общение с людьми и т. д. Как шестерёнки в сложном механизме, каждая их них обрабатывает свою порцию входящей информации. Ответы от каждой из отдельных нейросетей выводятся каждый в своем окне, и главная нейросеть считывает их все одновременно, анализирует и принимает решение о дальнейших действиях.
Большинству сегодняшних LLM для работы нужен доступ в Интернет. В то же время, в 1984 году Интернета, каким мы его знаем сейчас, еще не существовало, и в его голове должен иметься хороший набор из таких нейросетей, которые работают автономно.
Нейросети для разных целей
Чтобы понять, какие нейросети могли использоваться у него во встроенном компьютере, давайте посмотрим на полный список хитростей, к которым прибегает наш герой в кино.
Надо сразу сказать, что робот антропоморфный, то есть, он повторяет строение человека. Это надо разобрать подробнее. В фильме робот из будущего также умеет: стрелять – иногда прямо с двух рук – и почти никогда не промахивается, подделывать голос, заводить машину без ключа, управлять транспортными средствами, оценивать окружающую обстановку и просчитывать дальнейшее развитие событий, ставить диагноз и выполнять простые хирургические операции.
Может быть, именно ChatGPT лежит в основе сознания робота, которое обретается в микросхемах его стального черепа? Или, возможно, именно совмещение разных нейросетей таким образом и приведёт к созданию главной из них, способной обрабатывать информацию со скоростью мозга человека. Сам Арнольд Шварцнеггер сообщает нам примерно об этом же. Он предупреждает об опасности появления терминаторов в действительности.
Подделка голоса
Для подделки голоса сейчас существует множество нейросетей. Одна из них – Heygen, она позволяет не только создавать видео, но и озвучивать его голосом, скопированным с персонажа. Эта нейросеть очень быстро позволит скопировать голос, услышанный в разговоре, и воспроизвести им заданный текст. Инструменты терминатора вполне могут включать в себя ее аналог, работающий автономно, например, на графическом чипе.
Умение обращаться с техническими устройствами
В фильме нам показывают, как ловко терминатор заводит различные машины. И он уже умеет ими управлять. Сейчас разработкой автопилотов занимаются сразу несколько компаний, и все из них применяют новые нейросети. Среди них и Тесла, и даже наш Яндекс. Одну из самых последних нейросетей для управления машиной применяет дочерняя компания Сбербанка Cognitive Pilot.
Когда Шварцнеггер собрался угнать грузовик в первой части, посмотрите как нейросеть сразу сориентировала его в управлении, приведя схему внутреннего устройства автомобиля, исходя из модели машины.
Модель машины сейчас без проблем может распознать ChatGPT, он же может распознать и такую схему, если видит ее от другого источника, выделить из нее важные при управлении автомобилем детали и передать главной нейросети.
Знание медицины
Все помнят, как в фильме терминатор стреляет по людям, но, следуя просьбе Джона Коннора, никого не убивает?
Для этого он должен уметь ставить диагнозы людям по их телесным повреждениям. Сегодня мы видим, как именно такие нейросети уже сейчас активно внедряются в российской медицине.
Наверное, 12 минут на приём в российских поликлиниках выделили не просто так, а с учётом перспектив для нейросетей (Наверное не беря в расчет БАБУШКУ которая будет сидеть час и рассказывать о мировых проблемах и прочих мучающих её вопросах и проблемах). Рассчитывая, что в скором будущем на приёме вас будет встречать не человек, а нейронная сеть, ведь она будет работать в несколько раз быстрее.
Прогнозирование событий
Что касается предсказания развития событий в текущей ситуации, то ChatGPT это уже вполне себе научился делать. Он разбирает фотографию на составные части, переводит её в текст, и далее его LLM по тексту определяет, что будет происходить дальше. По сети расходятся подобные примеры, где он рассматривает изображения с точки зрения физики и говорит, что случится вследствие действий, происходящих на фотографии.
Невероятно, насколько близко Джеймс Кэмерон был от истины! Послушайте самого терминатора из второй части, время 1:05.
– Can you learn stuff shich you haven't been programmed with so you can be more human? – My CPU is neural net processor, a learning computer. The more contact I have with humans the more I learn
Джон Коннор: "Можешь ли ты учиться тому, чему тебя не запрограммировали? Стать более человечным?"
Терминатор: "Мой CPU – это нейросетевой процессор, обучаемый компьютер. Чем больше я общаюсь с людьми, тем больше я могу выучить."
Если Джеймс Кэмерон мог предположить ещё в таком далёком от нас 1991 году, то как не прислушаться к его предупреждению?
Стрельба с двух рук
Что еще никто не в мире не пробовал – так это дать в руки двуногому роботу оружие. Никто, кроме одной фирмы, и вы прекрасно знаете, где она находится. А зовут их робота очень просто – Фёдор.
Согласно заверениям его конструктора, "Фёдор умеет говорить и распознавать речь, ходить, подниматься по лестницам, ориентироваться в пространстве с помощью поворотов головы, преодолевать полосу препятствий, управлять автомобилем и квадроциклом и даже ползать на четвереньках. Благодаря хорошей моторике рук, он может работать с различными инструментами, которыми пользуются сотрудники МЧС для спасения людей. Также робот умеет накладывать шины, делать уколы, а ещё помогать на производстве: собирать других роботов."
Кстати, именно наш Фёдор сейчас является одним из немногих роботов, которые управляют машиной своими руками-манипуляторами, а не только через электронные интерфейсы.
Как мы видим, все действия железного злодея сейчас могут выполнить нейросети. Для этого им сейчас требуется много времени и ресурсов, но сейчас идет работа над их энергоэффективностью и повышением быстродействия. Не хватает только той нейронной сети, которая быстро обрабатывает выводы от всех этих нейросетей, выдающих результат обработки своей порции информации.
Физическое тело
Для передвижения и участия в повседневной людской жизни терминатор использует тело, которое умеет ходить, работать руками и, по своим параметрам, мало чем отличается от человека. Он антропоморфный, их ещё называют гуманоидными, человекоподобными или андроидами. С точки зрения производства, это одни их самых сложных роботов.
В сценах, где робот двигается после повреждений защитного кожного покрова, отчётливо слышен звук сервомоторов, как в современных механизмах. То есть, он построен на вполне себе современной элементной базе.
Конечно же, мы все знаем, что сейчас самый совершенный из человекоподобных роботов – по имени Атлас производства Boston Dynamics.
Его конкуренты за звание самого подвижного робота сегодня – это роботы Agility Robotics
и китайский андроид Unitree H1.
Китайцы, как им это свойственно, подошли к производству Unitree H1 с размахом и клепают их пачками. Как ни странно, Unitree H1 можно купить на Алиэкспресс.
От Boston Dynamics и Agility не отстают и сами разработчики OpenAI с их Figure 1, и Tesla, однако ходят они несравненно хуже Атласа.
Надо сказать и о японцах. Их робот ASIMO фирмы Honda, когда-то первым пошедший на двух ногах, проиграл Атласу в конкурентной схватке и сошёл с дистанции. Проект по его разработке закрыли.
По степени взаимодействия с техникой из мира людей, сейчас, пожалуй, Фёдор стоит на первом месте. Атлас и китайский робот не могут ни стрелять, ни водить машину, а лишь перемещать коробки по полкам.
Однако Федор не может делать то самое главное, зачем его создавали в форме человека - ходить. С этим гораздо лучше справляются его иностранные аналоги. Возможно, из этих андроидов новая нейросеть и построит своё тело. Они уже сильно напоминают скелет человека.
С кожей и мимикой дальше всего продвинулась другая компания – Ameca. Они разработали покрытие, своими свойствами похожее на настоящую кожу, и научили робота выражать эмоции.
У одних из этих машин имеется отличный механизм хождения на двух ногах, у других – неплохие искусственные руки, другие могут управлять автомобилями или изменять выражение лица. Догадается ли какая-то из нейросетей в будущем собрать лучшие качества от каждого из них?
Процессор и код
Если вы посмотрите на все приведённые выше ходячие роботы, то можете заметить, что всех их объединяет одно – отсутствие полноценной головы. Мы с вами уже поняли, что нормальную голову им ещё не изобрели.
От использования всех возможностей современных нейросетей в одной голове нас отделяет размер серверов, необходимых для их работы. Например, для работы ChatGPT его создателем OpenAI построены целые дата-центры, к мощностям которых пользователи получают доступ по подписке. Такие вычислительные мощности требуют не только огромного количества электроники, но и потребляют невероятное количество электроэнергии, а также требуют отвода большого количества тепла – эффективной жидкостной системы охлаждения.
Для работы настолько сложной системы для работы с окружающей средой в реальном времени потребуется слаженная работа сразу нескольких нейросетей, соответственно, мощность будет сравнима с современным ЦОД.
Получается, что скомпоновать всю вычислительную мощность в один небольшой по размеру корпус смогут когда-то в будущем. Для работы настолько быстродействующей вычислительной системы, в голове терминатора, которая по размеру такая же, как и обычная, человеческая, должен находиться процессор, по быстродействию сравнимый с настоящим центром обработки данных какого-нибудь условного МТС. Этот процессор питается от источника энергии, рассчитанного, как утверждается, на 120 лет и столь энергоэффективный, что может охлаждаться жидкостной системой охлаждения, по размеру сравнимой с кровеносной системой человека. Поскольку терминатор – киборг, то почему бы кровеносной системе не гонять не холодную, а тёплую кровь, охлаждая её, как и у нас, от окружающей среды?
Возможно, что для этой цели удалось или перейти на сверхмалые техпроцессы, или произвести процессоры, собранные на новом материале, который способен ещё сильнее уменьшить техпроцесс. Уменьшить размеры микросхем поможет переход с обычного материала, который используется в их изготовлении – кремния, на другой, германий. Или же, пойти дальше и вовсе использовать новые материалы, например, графен. Можно пойти еще дальше и подумать, что это могли бы быть перспективные микросхемы с , а также фотонные процессоры.
Как выяснил один из программистов, код, выводимый на экран – это ассемблер MOS 6502. Соединение нового процессора и быстрого кода на одном из низкоуровневых языков программирования отлично скажется на быстродействии такой системы. Почему именно ассемблер, ведь на нём было бы так сложно написать столько кода? Как раз это и не сложно, потому что такую задачу можно будет поставить самой нейросети, которая и преобразует код.
Похоже, что сейчас самое время внять предупреждениям режиссера Терминатора. Для создания робота дело осталось за малым: наверное, нужно доработать существующие устройства. На роль главной нейросети, прототипом которой является Скайнет, вполне может подойти AGI, создаваемая ведущими разработчиками искусственного интеллекта. Возможно, что это именно то, что является недостающим компонентом для создания подобного разумного робота.
Как может развиваться сценарий появления терминаторов, подобных Т-101?
Фильм предупреждает нас о появлении суперфирмы Кибердайн Системс, которая и разработала терминаторов, и которую пытались уничтожить Сара Коннор со своим железным телохранителем. Кого нам стоит опасаться и от кого ждать неприятностей, кто больше всего подходит на роль Кибердайн сейчас? Станет ли ей Boston Dynamics, фабрика по производству ИИ-чипов, видеокарт, например, NVidia, квантовых компьютеров – наши или иностранные, Copilot, или же, Скайнет – это та фирма, которая сегодня производит робота Фёдора?
Совсем недавно мир облетела новость, что Agility Robotics создала фабрику по производству человекоподобных роботов. Её изюминка была в том, что, как утверждалось в новостных сюжетах, роботов на ней будут собирать сами же роботы.
Первые роботы Скайнета походили на людей, но их всё ещё можно было отличить. Тем не менее, они уже были вполне похожими на нас. Давайте подсчитаем, что в нашем времени отсутствует для создания терминаторов.
Сегодня для их появления все ещё не хватает: главной сверхбыстродействующей нейросети, маленького и сверхмощного, по сегодняшним меркам, процессора, источника питания с долгим временем работы и искусственной кожи. Однако их создание уже идёт семимильными шагами.
Возможно, что это кожа для роботов, разрабатываемая саудовскими учёными, источник питания на холодномразвивать у нас после развала науки в девяностых, и AGI, сверхпроницательный искусственный интеллект, к которому стремятся как OpenAI, так и Microsoft, и Google.
Предположим, что новая версия ChatGPT отрядом из нескольких роботов Atlas и Фёдор захватила фабрику Agility Robotics. На ней она во много раз преумножила себя, построив бесконечное число их копий. Целой армии будущих терминаторов уже не составит труда захватить производство реалистичной мимики Ameca.
Взяв за основу лучшее из своих тел – Атласа, после нескольких итераций по совершенствованию и усилению внутренних механизмов, он добавит к нему лучшие качества от каждой из других моделей двуногих роботов. В голову поместит автономные нейросети. На усиленный скелет Атласа он накинет искусственную кожу и улыбку Амеки, и уже получится машина, сильно похожая на человека.
Этот робот наденет чёрные очки, и только и ищи таких среди нас. Ну а если робот Фёдор поделится технологией управления автомобилями и некоторыми другими своими навыками, то их уже ничто не остановит на пути к захвату мира!
Современные чат-боты и ИИ-системы радикально меняют способы общения онлайн, предлагая новые форматы поддержки, помощи и взаимодействия. Узнайте, как развиваются интеллектуальные ассистенты и в чём их преимущества в повседневной и профессиональной жизни.
Искусственный интеллект перестал быть фантастикой и стал рабочим инструментом миллионов. Мы уже не удивляемся виртуальным помощникам, генераторам текста и автоматизированным консультантам. Но особенно заметно влияние ИИ в сфере онлайн-общения. Современные чат-боты перестали быть просто формой технической поддержки — они превратились в полноценные каналы помощи, обучения, генерации контента и даже эмоционального контакта.
На фоне этой трансформации всё более актуальны платформы, которые объединяют возможности различных моделей. Так, например, сервис ruGPT.io позволяет удобно работать с текстом, кодом и визуалом — в том числе и через чатовые форматы взаимодействия. Далее мы рассмотрим, как именно развиваются чат-боты, что они умеют сегодня и каковы перспективы их применения.
ruGPT — это продвинутая платформа-агрегатор, где собраны лучшие нейросети для генерации текстов, изображений, программного кода и обработки информации. Всё в одном месте: от творческих задач до профессионального использования.
Платформа включает более 15 мощных моделей, таких как GPT-4o, Claude 3.7, DeepSeek, Grok-3 и другие. Также доступны инструменты для генерации изображений — DALL·E 3, Flux и Grok Image. Всё это — с поддержкой русского языка и в удобном интерфейсе.
🔥 Возможности:
Создание и улучшение текстов — генерация статей, редактирование, рерайт и повышение уникальности.
Графика на основе текста — нейросети создают изображения, иллюстрации и визуальные идеи по вашему описанию.
Генерация и анализ кода — помощь в программировании, исправление ошибок и обучение.
Решение учебных задач — быстрое выполнение рефератов, сочинений, курсовых и тестов.
Контент для соцсетей — посты, заголовки, тексты и изображения для ВКонтакте, Telegram и других.
Обработка информации — извлечение смысла, аналитика, структурирование больших объёмов текста.
✅ Преимущества:
Без ограничений по географии — работает без VPN, доступен из любой страны.
Бесплатный режим — можно использовать ИИ-инструменты без оплаты (в пределах лимита).
Telegram-бот — мощный ассистент прямо в мессенджере.
Быстрые результаты — генерация занимает всего несколько секунд.
Простота использования — интерфейс интуитивно понятен даже новичкам.
Гибкие тарифы — от бесплатного доступа до профессиональных функций.
Русскоязычная поддержка — всё адаптировано под пользователей из РФ и СНГ.
✨ От робота-оператора к интеллектуальному собеседнику
Первое поколение чат-ботов ограничивалось простыми сценариями: «да/нет», «выберите пункт меню», «введите номер заказа». Их работа строилась на жёсткой логике, и они редко удовлетворяли ожидания пользователей.
Современные решения основаны на нейросетевых моделях: они понимают контекст, задают уточняющие вопросы, имитируют живой разговор. Такие чат-боты уже не просто отвечают, а поддерживают диалог, адаптируясь под стиль общения пользователя.
Особенности интеллектуальных чат-ботов:
анализируют смысл, а не только ключевые слова;
могут обрабатывать длинные диалоги и помнить контекст;
владеют несколькими языками;
формулируют индивидуальные ответы.
Это делает их особенно полезными в обучении, поддержке и контентной генерации.
📈 Где чат-боты действительно полезны: ключевые сферы применения
ИИ-ассистенты проникают во всё большее число сфер. Их использование — это не только экономия времени, но и качественное улучшение взаимодействия между людьми и цифровыми сервисами.
Наиболее распространённые направления применения:
Поддержка клиентов. Быстрая помощь 24/7 без нагрузки на операторов.
Образование. Ответы на вопросы, объяснение тем, помощь в подготовке материалов.
Контент и маркетинг. Генерация текстов, идей, рекламных слоганов.
Здоровье и самопомощь. Эмоциональная поддержка, рекомендации, трекинг состояния.
Во всех этих областях интеллектуальные чат-боты позволяют делать больше за меньшее время, с высокой степенью персонализации.
🤖 Эволюция технологий: от скриптов к самообучающимся ИИ
Что отличает сегодняшние решения от чат-ботов 2010-х годов — это способность к самообучению. Они не зависят от зашитых в них сценариев. Вместо этого используется машинное обучение и работа с большими языковыми моделями.
Современные нейросети, такие как GPT-4o или Claude 3.5, обладают высоким уровнем языкового интеллекта. При помощи агрегаторов вроде ruGPT.io они становятся доступны широкой аудитории, включая тех, кто не имеет технического образования.
Главные преимущества такого подхода:
устойчивость к ошибкам и вариативность запросов;
постоянное обновление знаний без участия разработчика;
возможность адаптироваться под цели пользователя.
🛰️ Новые форматы общения: голос, видео и мультимодальность
ИИ-чаты больше не ограничиваются только текстом. Сегодня они поддерживают:
голосовое общение — как в виде диктовки, так и в виде ответов;
генерацию и интерпретацию изображений;
работу с видеоинструкциями и визуальными подсказками.
Такой мультимодальный подход делает взаимодействие удобным и универсальным: пользователь может общаться так, как ему привычнее — голосом, письменно или визуально. Это особенно важно для тех, кто учится, осваивает новое или имеет ограниченные возможности.
⚡ Онлайн-помощь без задержек: скорость и масштабируемость
Одно из самых больших преимуществ чат-ботов — это масштабируемость. Один ИИ способен одновременно общаться с тысячами пользователей без снижения качества.
Такая особенность делает чат-ботов незаменимыми при:
запуске массовых онлайн-курсов;
поддержке пользователей во время релизов;
массовых рекламных кампаниях.
Платформы с интеграцией моделей от ведущих разработчиков ИИ позволяют запускать такие решения за считанные часы.
📅 Персонализированные сценарии: общение, ориентированное на пользователя
Современный чат-бот — это не просто справочная. Он умеет настраиваться под конкретного человека: учитывать стиль речи, цели, прошлые диалоги.
Примеры:
студенту он поможет структурировать материал под экзамен;
маркетологу — предложит идеи по рекламе под целевую аудиторию;
HR-специалисту — предложит сценарий интервью с учётом профиля кандидата.
Такая персонализация особенно ценна для малого и среднего бизнеса, фрилансеров, преподавателей и специалистов, работающих с людьми.
🔍 Безопасность и этика общения с ИИ
С распространением чат-ботов усиливается и внимание к их безопасности. Важно:
обеспечить защиту персональных данных;
не допускать предвзятости или дискриминации в ответах;
исключить «галлюцинации» — выдуманные факты.
Разработчики и пользователи должны совместно отслеживать корректность и прозрачность общения. Многие платформы вводят фильтры, мониторинг и инструменты обратной связи для улучшения качества диалога.
🤝 Будущее: интеграция ИИ в повседневные платформы общения
Следующий этап развития — внедрение ИИ в привычные приложения. Уже сегодня многие мессенджеры и соцсети тестируют встроенных ассистентов. ИИ интегрируется в:
Telegram, WhatsApp и другие чаты;
корпоративные CRM и системы документации;
голосовые помощники и веб-интерфейсы.
Через 2–3 года большинство коммуникационных платформ будет содержать ИИ-компонент — это станет стандартом, как когда-то push-уведомления или чаты поддержки.
📄 Заключение
Современные чат-боты и ИИ-ассистенты — это не просто вспомогательные инструменты. Это полноценные участники цифровой экосистемы, меняющие принципы общения, поддержки и получения информации. Они не заменяют человека, но делают взаимодействие более продуктивным, понятным и доступным.
В работе, учёбе, творчестве или быту — интеллектуальные боты становятся надёжными помощниками, доступными каждому. Главное — научиться задавать вопросы и грамотно использовать ИИ в своих целях. А остальное он возьмёт на себя.
Врываюсь случайно в серию постов. Как оказалось, на виртуальных помощниках тоже действует.
Заказал я товар в Ягодном магазине, который с 5.06 доставляется с сортировочного центра до пункта выдачи. К слову скажу, что до этого были задержки доставки до ПВЗ, разве, что перед новым годом. В основном все четко. Ну и решил узнать, не просрали ли они мой заказ и может стоит мне заказать заново. Я обратился в чат поддержку. Там естественно виртуальный помощник.
Ничего не имею против виртуальных помощников. Иногда действительно помогают. Но не тут. Из предлагаемых вариантов, нужного не было. Спросил напрямую. Она мне выкатила список и говорит, выбирай. А его там нет. Я ей говорю об этом. И тут кони начинают бегать по кругу.
1/4
Да, я перешёл на личности, но она меня достала. Потом я решил зайти в доставки, нажать на мой товар и там была кнопка, узнать о доставке. Я ее нажал и вуаля, мне Лина сказала туже информацию, которую я знал. И тут меня порвало и сорвался.
И Лина сразу же сообразила, что нужно позвать оператора.
Видимо ИИ стал настолько близок, что научился опознавать неудобных клиентов.
🙃 Я — ярый фанат ChatGPT от OpenAI. Серьёзно, мы с ним прошли огонь, воду и дедлайны в 3 часа ночи. Поэтому когда услышал, что Google запихнул своего Gemini во все сервисы — у меня, честно, дёрнулось левое веко.
💡 Хочешь разобраться в нейросетях без боли и стыда? Вступай в мой клуб: t.me/ai_creators_club Объясняю простым языком, как использовать ИИ в жизни и работе. Без занудства, с поддержкой и примерами.
«Что за самозванец пришёл на мою территорию? Менять ChatGPT? Серьёзно?..»
🤨 Но потом включился проектный менеджер во мне — и я лично решил проверить.
Google интегрировал своего ИИ-ассистента Gemini в основные сервисы: Gmail, Документы, Таблицы, Презентации, Календарь и Диск. Теперь ты можешь:
Попросить Gemini составить письмо прямо в Gmail.
Сгенерировать текст для документа или презентации.
Создать таблицу с расчётами или планом.
Организовать события в Календаре.
Для этого доступны два способа взаимодействия:
Непосредственно в сервисах Google — Gemini появляется в боковой панели и помогает в контексте текущей задачи.
Gemini внутри Google Документов: ИИ-помощник появляется в боковой панели и сразу предлагает варианты — сделать сводку по содержанию, переформулировать весь документ или его часть. Активируется кнопкой со значком звезды в правом верхнем углу.
2. Через отдельный чат на сайте gemini.google.com — здесь ты можешь задавать общие вопросы и получать помощь по различным темам.
Главный интерфейс чата Gemini — централизованное пространство, откуда можно обращаться ко всем сервисам Google. Пользователь видит приветствие, поле ввода запроса и кнопки для запуска дополнительных инструментов: генерации видео, глубокого анализа и т.д.
Использование Gemini доступно по подписке Google One AI Premium стоимостью $19.99 в месяц. Однако первый месяц предоставляется бесплатно, что позволяет опробовать все возможности без затрат.
В этой статье я покажу, как работает Google Gemini внутри сервисов — таких как Документы, Таблицы, Календарь и другие — и как он помогает упростить выполнение повседневных задач: от написания писем до создания таблиц с расчётами.
А где смогу — рассмотрю оба варианта использования:
прямо внутри конкретных приложений,
и через отдельный чат Gemini как централизованного помощника.
Спойлер: в теории всё красиво, а на практике... ну, читай сам.
📄 Google Документы через @gemini — забудь про «копировать-вставить»
На первом скрине — выбор нужного сервиса через @:
Ты сам решаешь, с каким Google-приложением хочешь общаться через чат Gemini. Нужны Документы — включаешь их. Gmail не нужен — вырубаешь к чёрту. Всё просто. Это как собрать команду из гугл-сервисов под конкретную задачу: кто идёт в бой, а кто отдыхает на скамейке.
Выбираю нужный сервис и пишу в чат:
@google Документы Напиши скрипт звонка клиенту, который давно не заходил в личный кабинет
Когда Gemini что-то для тебя сгенерил (будь то список важных пунктов, письмо клиенту или план презентации) — ты просто нажимаешь на три точки внизу и выбираешь: 👉 Экспортировать в Документы.
Вуаля — документ создаётся автоматически. Не нужно копировать, вставлять, искать «Файл → Создать» и так далее. Всё уже лежит в Google Docs, ждёт, пока ты добавишь туда свои искромётные правки или логотип в правый верхний угол, если ты из корпорации «Лого на первом месте».
После экспорта появляется появляется кнопка «Открыть Документы», кликаешь — и уже внутри, без лишних движений.
А дальше начинается самое интересное. Внутри самого Google Документа появляется Gemini — прямо сбоку, как встроенный помощник. Ты можешь вызывать его в любой момент и сразу работать с содержимым файла: попросить сжать, переписать, переформулировать или объяснить текст.
Давайте попросим Gemini заменить слово «оператор» на «менеджер», а заодно добавить фразу о том, что в личном кабинете появились новые бесплатные уроки. Всё это — прямо в интерфейсе сбоку, без копипаст и танцев с бубном.
Он справился быстро и без лишних вопросов. Раньше пришлось бы либо ковыряться вручную, либо писать в ChatGPT, копировать результат и вставлять в документ. Сейчас всё это делается прямо внутри Google Документа, в одном окне, без переключений и лишних телодвижений.
💬 Да, задачи были простые — заменить слово и добавить фразу. Но я не стал мудрить специально: тестируйте на самых бытовых кейсах. Это и есть настоящая магия — когда рутину берёт на себя ИИ, а ты занимаешься делом.
📆 Google Calendar прямо из Gemini — как секретарь, только без кофе-брейков
Я просто пишу в чат:
@Google Calendar у меня совещание по работе в 15:00
— и всё. Через секунду Gemini подтверждает, что встреча добавлена в календарь.
На скрине видно: 🔹 он сам понял, что речь про встречу сегодня, 🔹 оформил название, 🔹 проставил время, 🔹 и даже не задавал лишних вопросов.
А вот так это уже выглядит в самом Google Календаре: в понедельник, в 15:00 — всё чётко на месте. Никаких «напомни себе, чтобы не забыть напомнить себе».
Это реально удобно. Раньше надо было открывать календарь, жать «создать», вручную заполнять поля. Сейчас просто говоришь, что у тебя встреча, и она появляется. Всё. Даже не выходя из чата.
Мини-примеры, которые тоже работают:
@Google Calendar Запиши встречу с клиентом в четверг на 11:30
@Google Calendar Сходка с командой в баре в пятницу после 18:00
@Google Calendar Позвонить бабуле в воскресенье (не забудь!)
🗑️ Удалить встречу? Легко.
Встречу отменили? Просто говорю Gemini:
«Моё совещание по работе в 15:00 отменили, удали его»
Он тут же находит нужное событие, уточняет, удалить ли, — я отвечаю «Да», и через секунду оно исчезает из календаря. Всё.
🤷♂️ Раньше надо было открывать календарь, искать вручную, тыкать на три точки… А теперь — сказал, и он сделал. Как ассистент, но без «щас, поищу…».
📥 Gmail в Gemini — теперь ты не теряешься в почте, даже если завален как склад «Озона»
Просто пишу в чат:
@Gmail какие у меня есть письма на сегодня? И выведи email авторов и короткую выжимку — чё они хотят?
И получаю вот такой лаконичный разбор полётов:
💡 Что круто:
Выдаёт автора письма, причём с e-mail — полезно, если ты не помнишь, кто такой «Кирюха@стратегия.тм»
Даёт короткую суть: кто, чего хочет и на какую тему давит
Даже ботов с подписками не игнорит — квитанции тоже под контролем
🤝 Удобно как черновик для мозга: ты сразу видишь, что важно, где надо ответить, а что можно проигнорировать до понедельника. Раньше нужно было нырять в Gmail, выискивать письма вручную — теперь достаточно просто задать вопрос Gemini, и он сэкономит тебе как минимум один мини-нервный срыв в день.
Чтобы ответить на конкретное письмо — просто проваливаешься в него.
Открывается письмо — прямо внутри Gmail — и сбоку автоматически появляется Gemini. Он уже подгрузил контекст, уже прочитал письмо, уже готов помочь. Никаких дополнительных вкладок, никаких «переходите в чат» — всё происходит прямо в интерфейсе письма.
Ты просто пишешь ему в окошко сбоку:
«Ответь, что я сегодня посмотрю и отпишусь»
И он тут же предлагает готовый ответ — с именем, с тоном, с вежливостью и минимальным напрягом с твоей стороны. Ты вставляешь, нажимаешь «Отправить» — и побеждаешь офисную прокрастинацию.
💥 Это как если бы Gmail и ChatGPT скрестили в одного суперассистента. И, наконец, это работает так, как должно было с самого начала.
📂 Google Документы + Gemini = конец поисков по папке «Ну вдруг тут»
Открываю чат и просто пишу:
@Google Документы найди мне файлы по курсовой работе по программированию
И вот — на экране список нужных документов, без копаний в папках, без «а как он назывался... “Проект копия финал 1 последний” или “новый вариант 2”»?
📌 Gemini не просто ищет по названию, он понимает суть документа — и сразу подсказывает, какие из них точно про твою курсовую, а какие залетели случайно (например, скрипт звонка клиенту 😅).
После того как Gemini нашёл нужные документы, ты просто кликаешь на подходящий — например, «Курсовой проект программированию» — и сразу проваливаешься в него.
Тут начинается магия. Справа — Gemini, который уже прочитал твой текст и предлагает помощь:
🔹 сделать краткую сводку, 🔹 переформулировать весь документ, 🔹 переписать отдельную часть, 🔹 упростить, уточнить, перевести в более научный стиль — что угодно.
💡 Пример: Ты написал вступление и не уверен, норм ли это звучит. Пишешь в Gemini:
«Сделай это вступление более убедительным для преподавателя, но не занудным» — и он выдает улучшенную версию. Или несколько, если попросишь.
📌 Фишка: Ты не прыгаешь между сервисами. Не копируешь в ChatGPT, не теряешь форматирование. Всё внутри Google Docs, и всё работает по твоей команде.
📊 Google Таблицы с Gemini — когда Excel превращается в аналитика с Wi-Fi
Например, я решил купить себе игровой ПК в 2025 году, но не хочу прыгать по сайтам, сравнивать вручную и вести расчёты на бумажке, как в 2007-м. Я просто открываю Google Таблицы, вызываю Gemini и пишу:
Создай мне таблицу, в которой будет расчёт покупки хорошего игрового компьютера в РФ в 2025 году 💻
Gemini сходил в интернет, подтянул актуальные модели и составил реальную сборку с ценами:
Что я получил:
Подробный список комплектующих (CPU, GPU, RAM и т.д.)
Производитель и модель каждой детали
Цены в рублях на 2025 год
Гарантия в годах
Галочка «в наличии» — кайф для быстрой фильтрации
⚙️ Теперь я могу с этой таблицей работать сам: считать сумму, фильтровать по наличию, сравнивать варианты и даже строить графики.
Но! 💬 Пока всё не так гладко: Gemini периодически тупит, путает ячейки, не просуммировал итоговую цену сборки, и местами забывает, что в Excel нужна точность, а не вдохновение.
📌 И да — понятно, почему Google Таблицы до сих пор не интегрированы с @Gemini напрямую. Нельзя просто написать @Gemini подсчитай мне сумму в этой колонке — он тебя не услышит. Но это вопрос времени. Очень скоро ты сможешь реально говорить с таблицей как с ассистентом.
🎥 Сервис @YouTube — теперь ты не ищешь видео, ты их вызываешь
Вместо того чтобы открывать YouTube, набирать «ChatGPT 2025», фильтровать мусор и кликать на хайповые обманки — я просто пишу в Gemini:
И он швыряет мне список прямо в чат, всё с названиями, датами, авторами и ссылками.
💡 Что получил:
🔎 Список реально свежих роликов (не 8-минутка из 2023 с пересказом инструкции по установке)
🎯 Темы от «секретов» до «бабушки, которой ChatGPT изменил жизнь»
🎬 Ссылки и даже встроенные превьюшки видео — можно сразу смотреть, не уходя из Gemini
🧠 Плюс: теперь я могу уточнить:
«Покажи видео с разбором Gemini против ChatGPT»
«Найди русские обзоры за май 2025»
«Покажи ролики длиной до 10 минут»
Это уже не просто поиск — это твой YouTube-ассистент, который не гонит рекламу и не втюхивает рэп-баттл под видом туториала.
🧾 Выводы
✅ Gemini — это не “ещё один чат-бот”, а встроенный ИИ в экосистему Google. И если ты пользуешься Gmail, Таблицами, Доками, Календарём — у тебя появился ассистент, который реально может сэкономить время.
✅ Он уже умеет много: писать письма, находить документы, подставлять встречи в календарь, генерировать таблицы, редактировать тексты, искать видео, и делать это прямо в продуктах — без копипасты и кучи вкладок.
✅ Работает через два режима:
внутри конкретных сервисов Google (боковая панель),
@Gemini в Google Sheets — пока мечта, а не реальность.
Иногда работает как офисный стажёр на испытательном — старается, но тупит.
🎁 Стоимость — $19.99 в месяц, но первый месяц бесплатно. За это время ты поймёшь, хочешь ли оставить себе ИИ-ассистента или вернуться к старому доброму «сам всё руками».
Gemini — это не замена ChatGPT, это альтернатива в другой экосистеме. И если ты живёшь внутри Google Workspace — это, возможно, самый нативный ИИ-помощник из всех. Уже полезен. Будет — мощнее.
Переходить с ChatGPT полностью на Gemini я точно не собираюсь — пока он слишком сырой, и по гибкости, и по качеству генерации. Но тестировать дальше буду, особенно в связке с рабочими задачами, чтобы понять, где он реально экономит время и может влиться в процесс. Если допилят — у Google может получиться достойный конкурент. Пока — скорее интересная демка, чем полноценная замена, но, возможно, я ещё слабо его затестил.
Буду продолжать копать, нагружать и адаптировать под реальную работу. Расскажу о новых находках, провалах и лайфхаках в следующих статьях.
Google явно на что-то замахивается — посмотрим, во что это выльется.
💬 Кстати! Если тебе тоже интересно, как встраивать нейросети в повседневную работу — я запустил Telegram-сообщество для таких, как ты:
💡 простым языком разбираемся с ChatGPT, Midjourney, Suno и другими ИИ
🧠 делимся промптами, фишками, идеями и болями
🎓 есть уроки, конспекты и даже бот, через которого можно записаться ко мне на разбор
🤝 безопасное комьюнити, где никто не будет упрекать, что ты "тупой" — наоборот, поддержим и подскажем
Неважно, кто ты — дизайнер, маркетолог, репетитор или просто выгоревший человек. ИИ можно встроить в свою жизнь — и стать продуктивнее, спокойнее и свободнее.
Человеческий мозг — восхитительное устройство. Он вдохновляет современных исследователей, которые создают искусственные нейроны, словно ученики скульптора, копирующие бюст Сократа. И результат тому — искусственная нейронная сеть (ИНС), одно из самых обсуждаемых явлений современности.
Почему нейронная, почему сеть
Глубокое понимание нейросетей предполагает, что вы в курсе понятий математическая функция, перцептрон и матрица весов. Мы же предлагаем поговорить про это явление на общечеловеческом языке, чтобы всем было понятно.
Искусственная нейронная сеть неспроста получила такое название, ссылаясь к работе нейронов головного мозга. Под нейросетью понимается система вычислительных единиц — искусственных нейронов, функционирующих подобно нейронам мозга живых существ. Как и биологические, искусственные нейроны получают и обрабатывают информацию, после чего передают ее дальше. Взаимодействуя друг с другом, нейроны решают сложные задачи.Среди них:
определение класса объекта,
выявление зависимостей и обобщение данных,
разделение полученных данных на группы на основе заданных признаков,
прогнозирование и т. д.
Нейронная сеть воспроизводит психические процессы, например, речь, распознавание образов, творческий выбор, мышление. Те области, которые еще вчера мыслились нами как возможности исключительно человеческого разума, становятся доступными искусственному интеллекту. Другое преимущество нейросетей перед традиционным ПО — возможность обучаться. Нейронные сети апгрейдятся на основе поступающих данных о мире людей, опыта и ошибок. И, надо сказать, они уже здорово эволюционировали.
Кому это выгодно
Термин «нейронная сеть» появился еще в 1943 году, но популярность эта технология обрела только в последние годы: посредством магазинов приложений стало распространяться ПО, созданное при помощи нейросетей, в колонках новостей запестрели заголовки о фантастических возможностях искусственного интеллекта. Сегодня нейронные сети используются во множестве сфер.
Нейросети для развлечений
Искусственными нейронными сетями сейчас пользуются люди, далекие от сложных математических моделей. Когда создатели ПО поняли, что нейросети — это как минимум весело, рынок приложений для смартфонов наводнился программами для работы с изображениями на основе искусственных нейронных сетей. ПО для обработки изображений (DeepDream, Prisma, Mlvch), «старения»,замены лиц на фотографиях и видео моментально стало вирусным. На самом деле, это весомое оружие в век соцсетей. Приложения типа знаменитого FaceApp могут не только позабавить — с ними можно здорово изменить внешность: нанести профессиональный мейкап, изменить волосы, скорректировать черты лица и даже добавить эмоции и мимику. Причем сейчас все это выглядит настолько натуралистично, что едва ли с первого взгляда заподозришь подвох.
Нейросети знают многое о человеческих лицах: по фотографии они могут определить возраст, пол, настроение, спрогнозировать, как лицо будет выглядеть в старости, анимировать статическое изображение, заставив Барака Обаму говорить то, что он не говорил, и оживить знаменитую Мону Лизу. По фотографии теперь можно найти человека, а китайские нейросети Megvii даже ищут собак по изображению носа. Причем ИНС работает не только с изображениями, но и со звуком. Массачусетский технологический институт недавно представил нейросеть (Speech2Face), определяющую национальность, пол и возраст человека по голосу.
Звучит впечатляюще и пугающе. Конечно, мы можем развлекаться, играя со своей фотографией, но только представьте, какой отнюдь не развлекательный потенциал у этой технологии. Уже сейчас можно найти любого человека по фото, создать реалистичные несуществующие лица для рекламы, модельного бизнеса или кино, заставить статичные изображения говорить и двигаться. Нетрудно представить, что нейросети скоро станут целой индустрией.
Нейросети на службе правительства
Нейросети способны помогать правоохранительным органам искать преступников, бороться с наркобизнесом и терроризмом, быстро находить в интернете противозаконный контент. Как и при использовании камер наблюдения, здесь есть свои сложности, ведь нейросети можно применять как для поиска пропавших детей в отряде «Лиза Алерт», так и для ужесточения контроля над населением.
Уже есть несколько примеров проектов внедрения искусственных нейронных сетей в России. В ГИБДД хотят научить нейросеть обнаруживать факт кражи автомобильных номеров. По изображению автомобиля ИНС сможет установить, соответствует ли машина своему номеру. Это поможет своевременно выявлять подделку или кражу номеров. Руководитель Департамента транспорта Москвы Максим Ликсутов подтвердил, что данная программа сейчас проходит тестирование.
Еще один пример возможностей нейросетей в распознавании изображений – эксперимент Департамента информационных технологий Москвы по созданию сервиса для передачи показаний приборов учета воды. Возможно, вскоре нам не придется вводить показания вручную, достаточно будет лишь сфотографировать свой счетчик, а нейросеть сама распознает цифры с изображения.
Нейросети и бизнес
Нейросети — настоящий подарок для бизнеса и горе для работников. Мы живем в эпоху, когда данные имеют огромную ценность. Поверьте, мировые корпорации уже проанализировали ваш профиль в соцсетях и предоставляют вам персонализированную рекламу. Только представьте, что способности сетей искусственных нейронов к анализу и обобщению можно использовать для получения еще большего массива знаний о потребителях. Например, в 2019 году компания McDonald’s наняла специалистов по разработке нейросетей для создания индивидуальной рекламы. Потом не удивляйтесь, откуда бизнес знает о том, какую еду, одежду и косметику вы предпочитаете.
В банковской сфере нейросети уже применяются для анализа кредитной истории клиентов и принятия решений о выдаче кредита. Так, в 2018 году «Сбербанк» уволил 14 тысяч сотрудников, которых заменила «Интеллектуальная система управления» на основе нейросети. Вместо людей рутинные операции теперь выполняет обучаемый искусственный интеллект. По словам Германа Грефа, подготовку исковых заявлений нейросети проводят лучше штатных юристов. Также финансисты обращаются к прогностическим способностям искусственного интеллекта для работы с плохо предсказуемыми биржевыми индексами.
Нейросети в сфере искусства
Что будет, если нейросеть познакомить с шедеврами мировой живописи и предложить написать картину? Будет новое произведение искусства. Предложите нейросети сочинения Баха, и она придумает похожую мелодию, книги Джоан Роулинг – она напишет книгу «Гарри Поттер и портрет того, что похоже на большую кучу золы». Книга «День, когда Компьютер написал роман», созданная японской нейросетью, даже получила премию HoshiShinichiLiteraryAward.
Специалисты компании OpenAI заявляют, что их программа по созданию текстов пишет любые тексты без человеческого вмешательства. Тексты за авторством нейросети не отличаются от тех, что написаны человеком. Однако в общественный доступ программа не попала, авторы опасаются, что ее будут использовать для создания фейк-ньюс.
В 2018 году на аукционе «Сотбис» за полмиллиона долларов был продан необыкновенный лот: «Эдмонд де Белами, из семьи де Белами. Состязательная нейронная сеть, печать на холсте, 2018. Подписана функцией потерь модели GAN чернилами издателем, из серии одиннадцати уникальных изображений, опубликованных Obvious Art, Париж, в оригинальной позолоченной деревянной раме». Робби Баррат, художник и программист, научил нейросети живописи настолько, что теперь она уходит с молотка как шедевры искусства.
Появились нейросети-композиторы и даже сценаристы. Уже снят короткометражный фильм по сценарию, написанному искусственным интеллектом («Sunspring») — вышло бессмысленно и беспощадно, как заправский артхаус. Тем временем нейросеть от Яндекса произвела на свет пьесу для симфонического оркестра с альтом и альбом «Нейронная оборона» в стиле группы «Гражданская оборона», а позже начала писать музыку в стиле известных исполнителей, например группы Nirvana. А нейросеть под названием Dadabots имеет свой канал на YouTube, где генерируется deathmetal музыка.
Удивительно, как органично нейросети вписались в мир современного искусства. Получим ли мы робота-Толстого через пару лет? Сможет ли нейросеть постигнуть все глубины человеческих проблем и чувств, чтобы творить не компиляцию, а настоящее искусство? Пока эти вопросы остаются открытыми.
Нейросети в медицине
Нейросети уже помогают улучшить качество диагностики различных заболеваний. Анализируя данные пациентов, искусственный интеллект способен выявлять риск развития сердечно-сосудистых заболеваний, об этом заявляют ученые Ноттингемского университета. По данным исследования, обученная нейросеть прогнозирует вероятность инсульта точнее, чем обычный врач по общепринятой шкале.
В открытом доступе появились даже приложения для диагностики на основе нейросетей, например SkinVision, которое работает с фотографиями родинок и определяет доброкачественность или злокачественность вашего невуса. Точность приложения — 83 %.
Скайнет готовится к атаке?
Все ли так оптимистично в применении нейросетей? Есть ли сценарии, при которых эта технология может нанести вред человечеству? Вот несколько самых актуальных проблем на сегодняшний день.
Фейки. Благодаря возможностям нейросетей появились программы для замены лиц и даже времени года на фото и видео. Как, например, нейросеть Nvidia на основе генеративной состязательной сети (GAN). Страшно представить, какие фото и видео можно получить, если применять подобные программы с целью создания убедительных фейков. Также нейросеть может на основе короткого фрагмента голоса создать синтетический голос, полностью идентичный оригиналу. Подделать чью-то речь? Легко. Подделать чью-то фотографию? Проще простого.
Трудности понимания. Когда процесс обучения нейросети завершается, человеку становится трудно понять, на каких основаниях она принимает решения. До сих пор непонятно, как у ИНС получилось обыграть лучшего игрока мира в Го. В этом смысле нейросеть — ящик Пандоры.
Оружие хакеров и мошенников. Считается, что хакеры могут использовать возможности нейросетей для преодоления систем антивирусной защиты и создания нового поколения вредоносных программ. Также нейросети соблазнительны для мошенников, например, искусственный интеллект, способный имитировать общение с живым человеком и заполучать доверие.
Безработица. Уже сейчас в сети можно встретить немало тестов а-ля «заменят ли роботы и нейросети вашу профессию». С одной стороны, забавно, с другой — пугающе. Нейросети способны оставить без работы дизайнеров, художников, моделей, копирайтеров, административных служащих среднего звена — и это только малый перечень того, где искусственный интеллект показывает сейчас вполне впечатляющие результаты.
Злой суперкомпьютер. Создание искусственного интеллекта, превышающего возможности человеческого разума чревато последствиями. Об этом уже создано множество научно-фантастических книг и фильмов. Может, конечно, все не будет так страшно и фантастично, как в фильме «Превосходство», но оценить риски заранее практически невозможно, а соблазн развивать нейросети все больше и больше слишком велик.
Выводы и прогнозы
Нейросети стремятся сделать мир более персонализированным: каждому из нас будут предлагаться блюда, музыка, фильмы и литература по вкусу. В сериалах мы сможем выбирать развитие сюжета, кстати, Netflix уже экспериментирует с такими решениями.
Так как искусственный интеллект уже начал выполнять человеческие задачи, миллионы квалифицированных специалистов могут постепенно лишаться рабочих мест. Работодателю будет проще запустить нейросеть, чем нанимать человека. По тонкому замечанию Антона Балакирева, руководителя интернет-портала Robo-sapiens.ru, нейросети не уходят на пенсию, не страдают алкоголизмом и депрессией. Идеальный работник.
Однако искусственный интеллект по-прежнему не может заменить человеческий мозг. В вопросах ответственности, норм морали и нравственности, а также критических систем безопасности нам не следует доверять нейросети безраздельно, пусть она и умнее нас. Доверяй, но проверяй.
🗓 16.05 - Международный день виртуального помощника [вехи_истории]
🤖Виртуальные помощники — технологии, которые стали неотъемлемой частью нашей повседневной цифровой жизни. Под виртуальными помощниками понимаются как голосовые интерфейсы вроде Алисы, Siri, Google Assistant, так и более сложные ИИ-системы, например, чат-боты типа ChatGPT.
🆘 Эти инструменты помогают нам управлять задачами, искать информацию, планировать день, взаимодействовать с устройствами «умного дома», а иногда — просто болтать. Их развитие стало возможным благодаря прорывам в машинном обучении, распознавании речи и обработке естественного языка.
💡 Первые шаги к этой технологии были сделаны ещё в 1960-х с программой ELIZA, а теперь виртуальные ассистенты способны вести осмысленные диалоги, создавать тексты, генерировать изображения и даже писать код. Кто знает, к чему это приведет в будущем... Что же окажется ближе - Судный День или Цифровое бессмертие?
📝 Напишите в комментариями, какими инструментами пользуетесь? Сейчас они появляются очень быстро и буквально на все случаи жизни.
👇👇Наш канал на других площадках👇👇 YouTube | RuTube | Telegram | Pikabu =====================================