Text
                    основы
ИИ и GPT
САМОУЧИТЕЛЬ ДЛЯ НАЧИНАЮЩИХ
Что такое искусственный
интеллект?
ИИ-это способность
машин обучаться и решать
задачи, как человек
Без сложных терминов!
Понятные инструкции
-W- Яркие иллюстрации
Примеры для практики
АЛЕКСЕЙ ГЛАДКИЙ
БОМБОРА
ИЗДАТЕЛЬСТВО

АЛЕКСЕЙ ГЛАДКИЙ основы ИИ и СРТ САМОУЧИТЕЛЬ ДЛЯ НАЧИНАЮЩИХ М БОМБОРА ИЗДАТЕЛЬСТВО Москва
ОГЛАВЛЕНИЕ Введение ...........................л ГЛАВА 1. Основы взаимодействия с ИИ простыми словами . . . .5 Что такое И И и как он работает.....................................5 Практические примеры использования ИИ в повседневной жизни..........8 Работа с видео и Лото..............................................1] Написание книг, статей, других текстовых материалов................12 ГЛАВА 2. Ваш персональный гид по текстовым чат-ботам GPT ..25 Общие сведения и принципы работы ChatGPT...........................25 Знакомимся с нейросетью YandexGP1..................................47 ГЛАВА 3. Как стать художником, или Учимся рисовать с помощью ИИ .................................................61 Нейросеть Artguru — просто и со вкусом.............................61 Генерируем изображения с помощью GigaChat......................... 69 Генеративная модель Kandinsky — удобный инструмент для рисования...91 ГЛАВА 4. «А музыка звучит»... Учимся создавать мелодии с помощью ИИ ..... 107 Особенности создания музыки с помощью И И....................... . 108 Пишем музыку с помощью нейросети Suno .......................... 113 Создаем музыкальные произведения с помощью Riffusion..............130 ГЛАВА 5. Искусственный интеллект как помощник, собеседник и друх .......................................143 В чем поможет виртуальный друг....................................143 Виртуальный помощник «Алиса»......................................145 Краткий обзор лучших голосовых помощников.........................152 Как выбрать голосового помощника..................................157 ГЛАВА 6. Безопасность и конфиденциальность в цифровую эпоху: руководство...........................................159 Основные меры безопасности.................................... .160 Опасности искусственною интеллекта............................... 173 Обратная сторона медали: как нейросети могут повысить уровень безопасности . . 182 ЗАКЛЮЧЕНИЕ..............................................................190 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ .................................................. 191
ВВЕДЕНИЕ Сегодня не уметь пользоваться искусственным интеллектом — почти то же самое, что не уметь читать. С помощью нейро- сетей проектируют дома и заводы, пишут программы и книги, создают картины и музыку, восстанавливают архивы, раскраши- вают видео, снимают фильмы, спасаются от тоски и одиночества и решают миллион иных задач промышленного, государственного и бытового характера. ИИ повсюду, и если мы его не замечаем, это не значит, что его нет. Более того: не умея пользоваться достижениями нейросетями, мы лишаем себя огромного количества удовольствия, очевидных удобств, денежных выгод и прочих преференций, которые лежат прямо перед нами. Их нужно лишь увидеть, взять и применить для собственного блага. Однако для многих обывателей ИИ остается чем-то непо- нятным, нереальным и недостижимым, вроде околонаучной фантастики. Вроде он и есть, но что это такое и как им пользо- ваться — да кто ж его знает? Мы решили восполнить этот пробел и предложить вам книгу, которая ответит на все вопросы, возникающие у неподготовлен- ного человека по поводу использования ИИ. Отметим, что рассмотренные в книге продукты и решения постоянно дорабатываются и совершенствуются разработчиками, а ИИ в принципе постоянно находится в процессе самообучения. Поэтому фактический функционал может иногда отличаться от представленного в книге. Но такие расхождения непринци- пиальны и никак не препятствуют освоению приемов и методов работы с современными нейросетями.
ГЛАВА 1 ОСНОВЫ ВЗАИМОДЕЙСТВИЯ С ИИ ПРОСТЫМИ СЛОВАМИ Откуда взялся ИИ ис чем его едят? Чем он отличается от обыч- ного взаимодействия человека с компьютером? Можно ли его потрогать? Как и для чего применить прямо сейчас? Ответы на эти и многие другие вопросы вы получите, про- читав первую главу. Что такое ИИ и как он работает Искусственным интеллектом принято называть аппаратно-про- граммные системы, которые могут имитировать человеческие когнитивные функции. В их числе понимание языка и стиля общения, рассуждение, анализ, самообучение, поиск и приятие решений, планирование и прогнозирование. Благодаря этому компьютеры могут выполнять задачи, тре- бующие реализации мыслительных процессов и традиционно считавшиеся подвластными лишь человеку. Особенности \л принцип работы Главная особенность ИИ — способность самостоятельно обучаться и принимать решения. Например, одна из схем классического взаимодействия человека с компьютером может выглядеть сле- дующим образом: 5
ГЛАВА 1 Основы взаимодействия с ИИ простыми славами ► написание программного кода; ► запуск приложения, его тестирование; ► выявление и анализ сбоев; ► доработка и редактирование кода с устранением ошибок; повторное тестирование; ► повторный поиск ошибок и сбоев и т. д.; ► сдача программы в эксплуатацию. В случае с ИИ все промежуточные этапы отпадают. Компьютер проанализирует код, найдет ошибки, исправит их и выдаст резуль- тат — готовую к применению программу. Условно говоря, он сам решит, когда нажимать Enter, а когда Esc. Роль человека сведена к минимуму. При этом на месте программы может оказаться книга, мелодия, картина, монохромное/цветное изображение, текстовый или звуковой диалог, а также любой другой продукт, создаваемый с помощью компьютера, сервера или сети. Самооб- учение ИИ осуществляется на основе: ► изначально заложенных команд и алгоритмов; ► информации, вводимой пользователем; ► данных, находящихся в открытом доступе (нейросеть знает все, что есть в Интернете и локальных источниках); ► результатов анализа собственных ошибок и неточностей. Таким образом, ИИ способен повышать свой уровень и рас- ширять собственные возможности без явного програ1ммирования или другого активного участия человека (за исключением поста- новки изначальной задачи и ее корректировки в дальнейшем). Одни из его ключевых элементов — нейронные сети. Так называют математические модели, построенные по аналогии со структурой человеческого мозга: они созданы из множества «нейронов» — взаимосвязанных узлов, которые принимают ин- формацию, дополняют и обрабатывают ее, после чего мгновенно обмениваются данными друг с другом. Б
Что такое ИИ и как он рабитавт Разновидности I/II/I В зависимости от применения, характеристик и функционала различают три разновидности искусственного интеллекта: ► ANI — слабый. Это И И узкой направленности, используемый для решения только тех специфических задач, для которых он был создан и обучен. Это, например, системы распозна- вания автомобильных номеров, денежных банкнот, челове- ческих лиц, рекомендательные решения в онлайн-магазинах и на маркетплейсах, голосовые помощники типа «Алисы» или 5iri, и т. п. ► АБ1 — общий. По уровню интеллекта такие решения сопо- ставимы с человеческим мозгом. Они предназначены для решения широкого спектра разноплановых задач, способны заниматься творчеством, легко обучаются и адаптируются к изменяющимся требованиям. Один из известных представи- телей этой категории— суперкомпьютер Summit, способный за одну секунду выполнять 200 квадриллионов операций (человек с подобной задачей справился бы за сотни милли- онов лет). Пример суперкомпьютера показан на рис. 1.1. Рис. 1.1 Суперкомпьютер 7
ГЛАВА 1 Всноиы взаимодействия с ИИ простыми сливами ► ASI — супер. Пока не существует в реальности, но если появится — будет во всех отношениях выше человеческого интеллекта. Многие ученые опасаются появления подобных систем, поскольку никто не берется предсказать, каким будет их поведение в тех или иных ситуациях. Решения на базе нейросетей и ИИ постоянно совершенству- ются, и сегодня трудно предположить, какие достижения появятся в этой сфере в ближайшие несколько лет. Но то, что ими можно успешно пользоваться уже сегодня, — фа кт. Практические примеры использования I/II/I в повседневной жизни ИИ востребован бизнесменами, разработчиками, представителями творческих и иных профессий, рядовыми обывателями. Рассмо- трим несколько наиболее характерных примеров использования ИИ в разных сферах деятельности. Бизнес Одна из сфер применения ИИ — бизнес в любых его проявлениях. Причем это касается не только владельцев компаний, руководи- телей, финансовых директоров и прочего топ-менеджмента: ИИ способен намного облегчить жизнь как высокопоставленным, так и рядовым сотрудникам. Так с его помощью предприятия и организации обеспечивают автоматизацию типовых, рутинных процессов. В их числе — ввод данных, обработка информации, классификация и сортировка документов, анализ результатов деятельности и пр. Это позволяет разгрузить персонал, высвободить время для решения стратеги- ческих и творческих задач. в
Практические примеры использования ИИ в пснсвдневной жизни Чтобы перенести информацию из первичного документа в учетную программу, не нужно вруч- ную вводить все реквизиты (номер, дату, сумму и т. д.). Просто отсканируйте его и отдайте ИИ: он сам распознает текст, переведет его в нужный формат и разнесет данные по соответствующим полям электронной формы. Важное преимущество такого подхода — минимизация ошибок, сбоев и прочих нештатных ситуаций, возникающих по причине человеческого фактора (невнимательность, зло- употребления и пр.). Также использование ИИ значительно ускоряет ход бизнсс-процсссов: во-первых, задачи выполняются намного быстрее; во-вторых, решения принимаются без лишних сомнений и волокиты. Еще одно направление для применения ИИ в бизнесе — ана- лиз и сопоставление данных. Нейросети умеют моментально анализировать огромные объемы информации и выявлять зако- номерности, которые человек обнаружить не в состоянии (или на это ему потребуются годы работы, в то время как ИИ справится за несколько секунд). Технологии ИИ активно применяются при составлении биз- нес-прогнозов. Разработанные на основе нейросетей модели предсказывают динамику спроса на товары и услуги, поведенче- ские настроения целевой аудитории, результаты проведенных рекламных кампаний и т. п. С помощью ИИ можно персонализировать предложения для клиентов на основании информации об их предпочтениях, ожиданиях, финансовых возможностях. Нейросети используются в чат-ботах служб клиентской поддержки: они отвечают на ти- повые вопросы, помогают решать наиболее распространенные проблемы, снимая нагрузку с операторов и других специалистов. Многие руководители предприятий и фирм доверяют И14 оптимизацию логистических цепочек. Нейросети оценивают 9
ГЛАВА 1 Основы взаимодействия с ИИ простыми славами предстоящий спрос, контролируют складские запасы, разрабаты- вают графики поставок сырья и отгрузки продукции. Есть решения на основе ИИ, способные разрабатывать новые товары и услуги с учетом пожеланий целевой аудитории и сло- жившихся на рынке тенденций. Возможности ИИ предусматри- вают разработку готовых бизнес-моделей, с четким определением тактических и стратегических задач, в том числе — для освоения новых рынков. Контрольная, охранная и розыскная деятельность Одна из самых востребованных возможностей ИИ — распоз- навание объектов. Самый простой пример — идентификация автомобильных номеров на охраняемых стоянках, паркингах, прочих закрытых территориях: шлагбаум откроется только в том случае, если номерной знак ранее внесен в базу данных системы контроля и управления доступом. С помощью нейросетей можно распознавать человеческие лица. Эта возможность востребована, например, правоохрани- тельными органами для быстрого розыска людей, чьи фотографии внесены в соответствующую базу данных. Как только камера зафиксировала разыскиваемого человека, информация об этом моментально рассылается по подразделениям полиции, и можно оперативно предпринять меры по задержанию. Функция распознавания лиц может использоваться также для контроля персонала на предприятиях и в учреждениях. С ней мож- но исключить несанкционированное проникновение посторонних на охраняемую или закрытую территорию: турникет откроется только для «своих» людей, внесенных в базу данных (рис. 1.2). Также распознавание лиц позволяет отслеживать перемещения сотрудников по офису, цеху или между структурными подразде- лениями компании, фиксировать несанкционированные отлучки и задержки, преждевременные уходы с работы, опоздания, прочие нарушения трудовой дисциплины. 10
Работа □ видео и фото Рис. 1.5. Идентификация человека га радужной оболочке глаза Системы видеонаблюдения в банках, микрофинансовых ор- ганизациях, кассах и других денежно кредитных учреждениях могут распознавать номиналы и серийные номера банкнот, а также идентифицировать ценные бумаги. Это позволяет установить реальную картину событий в спорных и конфликтных ситуа- циях. Более того, отснятый материал с идентифицированными денежными купюрами может использоваться как юридически значимый аргумент при проведении судебных разбирательств и оперативно-следственных мероприятий. Технологии на основе ИИ используются для распознавания находящихся в розыске предметов, потерявшихся домашних животных и решения иных аналогичных задач. Работа с видео и фото Здесь одно из самых популярных направлений — раскрашивание черно-белых фотографий и видеоматериалов. Едва ли не в каждом современном фотоателье можно заказать услугу по переводу старых снимков, негативных и позитивных пленок, слайдов и других исходников в цветной формат. 11
ГЛАВА]. Осноиы взаимодействия с ИИ простыми сливами Но это можно сделать и самостоятельно. В Интернете полно находящихся в свободном доступе веб-ресурсов и бесплатных при- ложений, куда нужно лишь загрузить черно-белую картинку — и она волшебным образом превратится в современное цветное фото. Для получения максимально достоверного ре- зультата могут потребоваться дополнительные действия: настройка параметров, выбор формата готового файла, корректировка цветопередачи и др. Это зависит от конкретного веб-ресурса или приложения, в любом случае порядок дей- ствий прост и интуитивно понятен. Практиче- ски всегда пользователи могут найти нужную информацию в инструкциях или обратиться к онлайн-помощнику (который, кстати, часто оказывается чат-ботом на основе ИИ). Одно из направлений работы современной киноиндустрии — раскрашивание старых черно-белых фильмов отечественного и зарубежного происхождения. Это довольно популярно: многие кинозрители, особенно старшего поколения, с интересом смотрят в цвете любимые фильмы, которые впервые увидели несколько десятилетий назад в черно-белом виде. Вместе с раскрашиванием киностудии применяют технологии по реставрации видео (также созданные с применением ИИ). Благодаря им даже кинокартины, снятые 60-80 лет назад, выглядят как современные произведения киноискусства. Написание книг, статей, других текстовых материалов ИИ внес серьезную лепту в процессы работы с текстовым контен- том. В зависимости от поставленной задачи он может написать краткий рассказ, придумать сюжет детектива, составить текст 15
Написание книг, статей, других текстовых материалов рассылки, подготовить небольшой экскурс в историю или любой другой материал, причем максимум за несколько минут (рис. 1.3). ChatGPT V i Подели! ься напиши описание зимнего угра Зимнее утро окутано мягкой тишиной, которую нарушает лишь хруст снега под ногами. Воздух свежий и прозрачный, мороз щиплет щеки, оставляя легкий румянец. Лучи зимнего солнца пробиваются сквозь ажурные ветви деревьев, покрытых инеем, и искрятся в снежных сугробах, рассыпая миллионы крошечных бриллиантов Легкий туман стелется над землей, придавая пейзажу загадочность и умиротворение. Мир будто застыл в ожидании нового дня, полного зимней сказки и спокойствия. Спросите что нибудь... <3 й2> 9 0» 0^ Рис 1.3. Описание зимнеги утра сгенериро^анние нейросетью ChatGPT В числе наиболее популярных сегодня текстовых нейросетей стоит отметить YandExEPT, Enpilnt (продукт компании Microsoft), EhatEPT, CigaEhat. Каждая из них поддерживает разные стили написания текстов: творческий, строгий, юмористический, офи- циальный, публицистический и т. д. Но результат во многом зависит от корректности и точности постановки задачи. Иногда написание текста с помощью ней- росетей превращается в многоэтапный итерационный процесс, который ведется в пошаговом режиме с постоянным внесением доработок и изменений. Например: ► нейросети поставлена задача: «напиши детективный рассказ из десяти абзацев с завершенной концовкой и хэппи-эндом»; ► после прочтения результата задача уточняется — «добавь информацию про главного героя, который получил тайное письмо, из-за которого он впал в панику»; 13
ГЛАВД1 Оснсиы взаимодействия с ИИ простыми слезами ► следующая доработка — «придумай, каким образом домра- ботница главного героя могла быть причастна к его счастли- вому спасению» и т. д. Подобных уточнений может быть сколько угодно. Это позво- ляет изменить сюжет, дополнить его новыми интригами и полно- стью преобразить произведение по сравнению с первоначальным вариантом. Многим писателям и копирайтерам знакомо такое понятие, как «страх белого листа» — когда автор не знает, с чего начать свое повествова- ние. С этим явлением сталкиваются и новички, и профессионалы с многолетним стажем. Так вот: нейросеть прекрасно решает эту проблему. Даже если сгенерированный текст по каким-то причинам не понравится, в нем обязательно найдутся моменты, которые могут послужить отправной точкой для написания авторского контента. Хотя ИИ способен генерировать в целом неплохие тексты, он не может выступать в качестве полноценного автора, и полностью полагаться на него не стоит вот почему: ► При нехватке достоверной информации нейросеть может подменять факты или что-то додумывать от себя. Это особенно неприемлемо при подготовке исследовательских, учебных или рабочих материалов. ► Конфиденциальность нейросетей оставляет желать лучшего. Введенные запросы они могут впоследствии использовать для обучения своих языконых моделей. Кроме этого, лич- ные и конфиденциальные данные иногда похищают в ходе хакерских атак. 14
Написание книг, статей, других текстовых материалов ► Текст, написанный И 1/1, в любом случае требует редактуры и прочих доработок. Опытный человек всегда определит, что стиль изложения и манера подачи материала характерны для алгоритмов, используемых нейросетями. Не стоит просто копировать то, что получилось в ходе диалога с чат-ботом, и использовать эго как живой текст. Однако взять сгенерированный нейросетью материал за осно- ву (это может быть идея, стиль написания, структура, некоторые фрагменты) и сделать из него качественный текстовый контент вполне реально. Кроме создания текстового контента, вышеупомянутые ней- росети могут решать и другие задачи: ответы на поставленные вопросы, генерация изображений, анализ данных и пр. Артомобилестроен1яе Это одно из самых спорных, но тем не менее активно реализуе- мых направлений использования ИИ. Главные дискуссии ведутся по поводу того, до какой степени можно делегировать функции управления автотранспортом технологиям на основе ИИ. Многие современные автомобили оснащены целым арсеналом интеллектуальных помощников водителя. В их числе системы контроля усталости водителя, мониторинга «слепых зон», пре- дотвращения столкновения и т. д. В этом ряду особо выделяется инновационная технология S-Max, разработанная специалистами корпорации Ford. Она сканирует дорожные знаки и разметку, и на основании полученной информации автоматически кор ректирует скорость транспортного средства. Если необходимо замедлить движение, это делается без использования тормозов — сокращается объем топлива, подаваемого в двигатель. Подобная инновация реализована и в электромобилях Tesla. Интеллектуальная система предотвращения столкновений в опас- ной ситуации автоматически снижает скорость машины вплоть до полной остановки. 15
ГЛАВА! ПеноьЬ) взаимодействия с ИИ простыми словами Самая высокая степень интеграции ИИ с автомобилем предус- матривает полную передачу управления встроенному автопилоту. В подобной ситуации водитель не нужен и фактически превра- щается в пассажира. ИИ полностью контролирует дорожную обстановку (знаки, светофоры, разметку, прочие средства орга- низации движения, плотность транспортного потока), распознает опасные и прочие нештатные ситуации, автоматически отдает соответствующие команды органам управления (рис. 1.4). Рис 14 Дытимпбили под управлением ИИ на дороге Дпщвго пользования Машина под управлением автопилота: ► следует по заданному маршруту; ► анализирует и контролирует ситуацию на проезжей части; ► знает и соблюдает ПДД; ► корректно и безопасно ведет себя по отношению к другим участникам движения. Автопилот под управлением ИИ состоит из нескольких ос- новных компонентов: ► На крыше автомобиля находится лазерный дальномер. Он сканирует все окружающее пространство в радиусе 100 мет- 15
Написание книг, статей, других текстовых материалов ров и на основании полученной информации автоматически генерирует карту в 3 D-представлении. ► Параллельно работает радиоволновой радар, задача которого — определение расстояния до объектов, а также траектории и скорости их движения. Это предоставляет автопилоту информацию о динамике дорожной ситуации. ► Датчики и прочие средства спутниковой навигации опреде- ляют текущие координаты автомобиля, позволяют контроли- ровать маршрут следования. ► Одна или несколько видеокамер распознают сигналы све- тофора, дорожные знаки и разметку, а также фиксируют транспортные средства и другие объекты, которые могут находиться в опасной близости от автомобиля. Несмотря на впечатляющие результаты, полная передача управления транспортным средством искусственному интел- лекту пока выглядит скорее как интересная идея, чем реальная перспектива. Возникает слишком много вопросов технического, юридического и организационного характера. Во-первых, любая техника может отказать: сгорел предохра- нитель, отошел контакт, в программное обеспечение проник вирус. И если, например, выйдет из строя радиоволновой ра- дар или система оптического распознавания знаков светофора, то высокоинтеллектуальный автомобиль превратится в груду неуправляемого железа. Во-вторых, кого привлекать к ответственности в случае ДТП, если водитель как таковой отсутствует? Производителя автомоби- ля? Разработчика автопилота? Собственника машины? Ни в одной стране мира действующее дорожное законодательство не даст ответа на эти вопросы. В третьих, работа интеллектуального автопилота явно под- разумевает наличие постоянного доступа к Интернету, хотя бы для регулярного обновления ПО. А если связь где-то пропадает? Сегодня в любом ^мегаполисе можно найти места, где трудно 17
ГЛАВА 1 Основы взаимодействия с ИИ простыми славами выйти в Интернет (плотная застройка, обилие помех и пр.). Тогда автопилот может просто зависнуть с непредсказуемыми последствиями. Однако все перечисленные препятствия не умаляют достоинств ИИ в сфере автомобилестроения. Эго впечатляющие разработки, которые при определенных обстоятельствах и условиях могут находить практическое применение — например, на дорогах специального назначения с минимальным трафиком. Использование ИИ для создания музыки Нейросети активно используются для создания музыкальных произведений. Конечно, сгенерировать шедевр мировой музыки с помощью ИИ не удастся, но получить фоновую мелодию, музы- кальные эффекты для компьютерных игр, видеороликов и фильмов вполне реально. Использование ИИ дает следующие преимущества: ► экономия времени—не нужно тратить его на работу с ин- струментами, как это обычно требуется при использовании классических аудиоредакторов; ► минимум усилий с помощью одного заготовленного шаблона можно создать несколько мелодий, после чего выбрать из них оптимальный; ► простота и удобство процесса — не обязательно быть профессиональным музыкантом или специалистом в 1Т-сфере, сгенерировать мелодию с 1/11/1 может даже ря- довой обыватель. Нейросети, используемые для создания музыкальных про- изведений, в зависимости от принципа работы делятся на три категории. К первой относятся те, которые работают по шаблонам. Ней- росеть использует загруженные композиции для самообучения, а мелодия генерируется на базе текстового описания, введенного пользователем. Это позволяет создавать полноценные музыкаль- на
Написание книг, статей, других текстовых материалов ные произведения, в том числе с добавлением спецэффектов и вокальных партий. Вторая катстория нейросетей работает по нотам. Результат генерации — не звуковая композиция, а партитура в виде после- довательности аккордов, нот и других музыкальных символов, используемых в нотной грамоте. На их основании затем вос- производится готовая мелодия. Такие нейросети используют, как правило, для создания фоновых музыкальных произведений, поскольку они не поддерживают работу с человеческими голосами и воспроизведение разных тональностей. Третья категория нейросетей работает по загруженному треку. ИИ может добавлять спецэффекты, смешивать отдельные отрывки, разделять звуковые дорожки. Результат генерации — полноценный аудиофайл, однако его характеристики и качество в значительной степени зависят от точности и корректности обучения. С помощью таких нейросетей можно создавать музыкальные произведения неплохого качества, однако может исказиться ритм-секция или произношение. В соответствии с действующим законодатель- ством музыкальный контент, сгенерированный ИИ, не может считаться авторским, поэтому он не защищен авторскими правами. Это обуслов- лено тем, что по закону автором признается толь- ко человек (а не нейросеть), творческим трудом которого создано конкретное произведение. В числе наиболее популярных нейросетей для создания музы- ки стоит отметить «Маэстро» от Сбербанка России (генерировать мелодии можно прямо в мобильном приложении «Сбербанк Он- лайн»), 5uno Al, MEdia.io, Riffusinn, Loudly, AIVA. Обратите внимание: в их числе как бесплатные, так и платные продукты. Более подробно процесс создания музыки с использованием ИИ рассмотрим в главе 4. 19
ГЛАВА!. Основы взаимодействия с ИИ простыми славами Создание изображений ИИ можно использовать для генерации картин и других изобра- жений. Как и в случае с музыкальными нейросетями, нс стоит рассчитывать на создание шедевров мировой культуры. Однако получить добротную графику, подходящую для использования в коммерческих, дизайнерских или иных подобных целях, вполне реально (рис. 1.5). Рис. 1.5 Картинка, сгенерированная искусственным интеллектом С помощью ИИ можно генерировать: ► векторные и растровые изображения; ► портреты, групповые рисунки; ► иллюстрации к книгам, исследовательским работам, докла- дам, презентациям; ► логотипы, иконки, эмблемы, фирменные знаки; ► материалы рекламного и маркетингового характера. 5U
Написание книг, статей, других текстовых материалов Качество изображений, их детализация и прочие характери- стики во многом зависят от корректности постановки задачи. Общение с нейросетью может напоминать раз- говор с маленьким ребенком Искусственному интеллекту необходимо четко и внятно поставить задачу, при необходимости уточнив ее столько раз, сколько потребуется для достижения требу- емого результата и буквально разжевывая дета- ли. Обойтись без этого можно лишь тогда, когда генерируется простое, понятное изображение, не содержащее большого количества деталей. ИИ можно использовать не только для получения полноцен- ного результата, но и на отдельных этапах работы. Например, нейросеть может сгенерировать общую идею, своеобразный «кар- кас» будущей картины, а детали додумает и доделает человек. Также ИИ незаменим, когда нужно за короткое время создать много однотипных картинок, из которых можно будет выбрать один или несколько подходящих вариантов. В числе наиболее популярных нейросетей для создания изо- бражений можно отметить MidjournEy, «Шедеврум», Runway ML, Bing Image Creator, Stable Diffusion и др. При выборе учитывайте следующие параметры: ► набор доступных основных и дополнительных инструментов; ► статус нейросети — платная или бесплатная (один и тот же продукт может иметь обе версии, в последнем случае функ- ционал будет ограничен); ► гибкость настройки, возможность адаптировать ИИ под конкретные требования; ► поддерживаемые языки (английский есть практически везде, также много русскоязычных продуктов и версий); ► характеристики сохраняемых файлов (формат, цветность, разрешение, объем). 21
ГЛАВА 1 Основы взаимодействия с ИИ простыми славами Помните, что зарубежные нейросети могут оказаться недо- ступными для пользователей из России. В таких случаях проблема решается с помощью VPN или других анонимайзеров. Обработка естественного языка Это направление считается одним из наиболее перспективных сфер использования ИИ. Технология известна также под аббревиатурой NLP — Natural language processing, в переводе с английского — «обработка есте- ственного языка». Она позволяет машинам и компьютерам пони- мать человеческий язык и генерировать речь, интерпретировать высказывания, анализировать сообщения, манипулировать фра- зами, а также обрабатывать речевой контент иными способами. Сложность заключается в том, что любой язык — достаточно сложный объект для анализа. Во-первых, он наделен смыслом. Передаются не просто буквы и звуки, а конкретная информация, которую нужно правильно интерпретировать. Во-вторых, слова и фразы могут произноситься с разными акцентами и интонацией, речь иногда бывает слишком быстрой и не всегда разборчивой (например, «проглатываются» оконча- ния, приставки или целые слова). Люди в подобных ситуациях понимают друг друга благодаря интуиции, лингвистическому и жизненному опыту, образному мышлению. Но компьютерам для распознавания и корректной интерпретации подобной речи не- обходимо обработать и проанализировать множество параметров. В-третьих, есть множество лексических, грамматических, идиоматических, синтаксических особенностей, которые меняют смысл сказанного и усложняют восприятие. Например, такие слова как «печь», «стекло» или «пила» могут выступать в качестве как существительных, так и глаголов. Поэтому необходимо обучить нейросеть распознавать смысловые связи. В-четвертых, любой язык содержит массу неологизмов, жаргонизмов, фольклорной и профессиональной лексики, иных 25
Написание книг, статей, других текстовых материалов нестандартных фраз и оборотов. При этом словарный запас людей беспрерывно пополняется. Поэтому алгоритмы распознавания и интерпретации человеческой речи, используемые нейросетями, должны постоянно обучаться. Несмотря на все перечисленные сложности, обработка нейро- сетями естественного языка уже сегодня нашла широкое приме- нение на профессиональном и обывательском уровне. Например, многие с удовольствием пользуются виртуальными помощниками типа Алисы, 5iri, Маруси, Alexa и т. п., получая от них интересую- щую информацию или просто используя в качестве собеседников. Голосовые чат-боты повсеместно применяются в колл-центрах и службах клиентской поддержки. К этой же серии относятся решения на базе ИИ, разработанные специально для одиноких людей, лишенным «живого» общения. Они разговаривают с ботом как с человеком, обсуждая интересующие вопросы, высказывая свою точку зрения на те или иные вопросы, делясь наболевшим и даже обмениваясь анекдотами. Одно из популярных направлений использования NLP — язы- ковой перевод, в том числе синхронный. Проводится обучение ней- росетей на огромных массивах двуязычных данных, благодаря чему они обретают способность переводить речь с учетом грамматических, лексических и других нюансов, а также контекста обсуждаемой темы. Обработку естественного языка используют поисковые сис- темы и роботы. ИИ анализирует и корректно интерпретирует полученный от пользователя запрос, выделяет ключевые сведения, ищет подходящие источники (базы знаний, документы, архивы и пр.), формулирует конкретные и релевантные ответы. Наибольшее распространение технологии обработки есте- ственного языка получили в следующих сферах деятельности (это касается как голосового общения, так и печатного текста): ► Образование и наука. На основе N LP создаются интеллекту альные системы обучения. Они воспринимают человеческую речь, персонализируют учебный процесс с учетом потребно- 53
ГЛАВА 1 Основы взаимодействия с ИИ простыми славами стей конкретного человека, взаимодействуют с пользователем в интерактивном режиме. ► Электронная коммерция. И И способен формировать индивиду- альные предложения (рекомендации товаров и услуг) клиентам на основе предварительного изучения их предпочтений и ана- лиза истории просмотров. Кроме этого, нейросети активно используют для работы с отзывами покупателей и заказчиков, чтобы узнать их мнение о продвигаемых продуктах и брендах. ► Здравоохранение. Технологии NLP незаменимы для ана- лиза больших объемов информации из медицинских карт и историй болезни пациентов, клинических записей и иной документации. Это позволяет совершенствовать диагностику, выявлять тенденции и закономерности, составлять прогнозы, повышать уровень обслуживания клиентов. ► Финансы и кредит. С помощью технологий N L Р нейросети автоматизируют процессы сортировки и анализа финансовых отчетов, обработки кредитных заявок, изучения бизнес-пла- нов. Это необходимо для минимизации рисков, предоставле- ния индивидуальных финансовых рекомендаций, пресечения попыток мошенничества. ► Юриспруденция. ИИ распознает и систематизирует доку- менты, анализирует содержимое договоров, дает рекоменда- ции, решает иные вопросы. Это снимает нагрузку с юристов и других профильных работников. Технологии обработки естественного языка активно использу- ются политтехнологами и другими аналогичными структурами (включая так называемые «фабрики троллей») в периоды прове- дения предвыборных кампаний и прочей электоральной актив ности. Они востребованы спецслужбами (в том числе органами государственной безопасности и подразделениями по борьбе с кибермошенничеством), работниками рекламных и HR-отделов, а также другими специалистами, которым приходится иметь дело с большим количеством речевого и текстового контента.
ГЛАВА 2 ВАШ ПЕРСОНАЛЬНЫЙ Г1/1Д ПО ТЕКСТОВЫМ ЧАТ-БОТАМ GPT Чат-бот — это программный продукт для интерактивного вза- имодействия с пользователем посредством голосовых или текстовых сообщений. Как правило, у него простой пользовательский интерфейс, удобный и интуитивно понятный инструментарий. Это позволяет работать с чат-ботами даже людям с минимальным или отсут- ствующим опытом: приемы использования осваиваются легко и в большинстве случаев без посторонней помощи. Исключение — нейросети для профессионального или уз- коспециального применения, разработанные с конкретными целя- ми для определенного круга пользователей. Но о них в этой книге мы говорить не будем. Рассмотрим порядок работы на примере двух популярных текстовых нейросетей — ChatCPT и YandaxDPT, адресованных широкому кругу обывателей. Общие сведения и принципы работы EhatCPT Чат-бот Eha+БРТ — это мультимодальный ресурс, который может работать не только с текстами, но также с картинками, прочими изображениями и звуковыми материалами. Но большинство пользователей работает с ним именно для генерирования текстов. 55
ГЛАВА В иаш персональный гид пп текстовым чат-Бстам GPT Не стоит предъявлять к нейросетям завышенные требования. При всех своих достоинствах ИИ — это не человеческий разум. У него нет сознания и своего мнения, поскольку он — лишь система алгоритмов, генерирующих ответы на основании информации из разных источников. Поэтому бесполезно спрашивать у чат-бота, что он думает о текущих политических событиях, недавно вы- шедшем фильме, новых религиозных течениях или других темах — адекватный ответ получить будет невозможно. ИИ генерирует тексты с учетом того, как он был запрограмми- рован и обучен. Он не будет создавать контент на запрещенные и аморальные темы — например, как скачать пиратскую книгу, обмануть систему безопасности банка или сделать ринопластику в домашних условиях (рис. 2.1). ChatGPT ' как скачать пиратскую книгу Я не могу помогать с поиском пиратского контента. Но могу порекомендовать легальные способы получить доступ к книгам: 1. Библиотеки. Многие библиотеки предоставляют бесплатный доступ к электронным и бумажным книгам. 2 Легальные онлайн-платформы Откройте для себя проекты вроде LitRes, Bookmate, Google Books и Amazon Kindle — они часто предлагают бесплатные книги или пробные периоды. 3. Открытые ресурсы Воспользуйтесь сайтами с произведениями в общественном достоянии, например. Project Gutenberg или lib.ru. Если ищете что-то конкретное, могу помочь найти легальные источники. © Ф Ф (5 <3 *0 0~ Сообщить ChatGPT 4- ® Поиск Q обоснуй Q Рис. 5.1 Нейросеть отказывается давать протиасзак ;нные советы В большинстве случаев работа с чат-ботом ведется в формате непринужденного диалога. Пользователь ставит задачу (макси- ЕБ
□ Б щи в сведения и принципы раБигы ChatGPT мально конкретно и детально), проверяет результат и при необ- ходимости просит внести дополнения и изменения. Этот процесс может длиться достаточно долго — в зависимости от требований к конечному результату. Платная и бесплатная версии У нейросети EhatCPT есть бесплатная и платная версии. Даже в первом случае она — полнофункциональный продукт и дает пользоваться всеми основными инструментами. Например, на про- стой вопрос типа «что такое электрический ток?» или «как отмыть старую плитку в ванной?» последует не просто однозначный ответ, а будет сгенерирована структурированная статья с подробным раскрытием темы (рис. 2.2). напиши что такое электрический ток Электрический ток — это упорядоченное движение заряженных частиц (электронов, ионов) под воздействием электрического поля. Основные характеристики электрического тока: Сила тока (I) — количество заряда, проходящего через поперечное сечение проводника за единицу времени (измеряется в амперах. А). Формула: I = 2. где Q — заряд, t — время. Напряжения (U) — разность потенциалов между двумя точками цепи (измеряется в вольтах В). • Сопротивление (R) — способность проводника препятствовать движению заряженных частиц (измеряется в омах. Ом). Связь между этими величинами описывается законом Ома* Виды электрического тока: Постоянный ток (ОС) — ток. который сохраняет постоянное направление и величину. Переменный ток (АС) — тою который периодически меняет направление и величину. Примеры использования; Электрический ток используется для передачи энергии в бытовых приборах, промышленном оборудовании и система, связи О» (5> £> 9 tv 0 Сообщить ChatGPT ОмКЭТ может допуосатъ ошиохк. Рвкоме» дугм проверять нжхуто информацию, Рис Е Е. Нейросеть ChatGPT сгенериссЕ-ала текст про электрический ток Е7
ГЛАВА 5. маш персональный гид по текстовым чат-Ботам GPT В этом несомненное преимущество перед тем же Google или любым другим поисковиком: он лишь выдает перечень ссылок, и нужно потратить немало времени для поиска требуемой инфор- мации. Нейросеть всю эту работу берет на себя, собирая самую важную информацию и выдавая готовый ответ. Бесплатная версия EhatCPT генерирует тексты в разных фор матах, стилях и жанрах. Ее можно использовать для написания школьных сочинений, коммерческих рассылок, сценариев, расска- зов и эссе, докладов, выступлений для конференций или презен- таций и пр. Нейросеть одинаково успешно напишет детективный или любовный рассказ, составит драматический сюжет, создаст рецепт приготовления блюда или меню для торжественного ужина. Еще одна полезная функция бесплатной версии EhatEPT — ра- бота с загруженными файлами. Например, можно загрузить текст в формате dOE, .dOEX, .txt или .pdf и попросить сделать рерайт, трансформировать в таблицу или список, переработать сюжет с учетом конкретных пожеланий. Если не хочется заморачиваться с загрузкой, просто скопируйте материалы в чат методом сору/ paste (если материал объемный, это можно сделать в несколько заходов: EhatGPT поймет все правильно). Платная версия EhatGPT предоставляет доступ к дополни- тельным функциям и возможностям. В их числе так называемые «рассуждающие» модели □1-mini и dl-preview, которые дольше обдумывают и генерируют ответы, но незаменимы для решения задач повышенной сложности. Например, их удобно использовать для написания текстов на темы, связанные с наукой, исследова- ниями, высокими технологиями. Также пользователи платной версии могут самостоятельно создавать специализированных ботов для решения конкретных задач. Например, такой инструмент полезен для автоматического проставления буквы «ё» в текстах или решения других аналогич- ных задач. Кроме этого, в платной версии EhatEPT доступ к функ- циям, находящимся в стадии бета-тестирования, предоставляется раньше по сравнению с бесплатным продуктом. 58
□ Бщир сведения и принципы работы ChatGPT Принцип работы моделей ol-mim и ol-preview во многом базируется на использовании «цепо- чек размышлений». Каждый запрос пользователя они дробят на отдельные фрагменты и пооче- редно разбираются с каждым из них. При этом можно визуально отслеживать ход процесса, поскольку нейросеть комментирует каждый этап отображением сообщений «Думаю», «Ана- лизирую», «Рассматриваю», «Пишу» и т. д. Если щелкнуть мышью на любом из них, откроется подробный перечень шагов, которые делает нейросеть для получения нужного ответа. Особенности и ограничения ChatGPT Поскольку любая нейросеть, включая ChatGPT. — это не «живой» разум, а набор алгоритмов, полученный результат требует вни- мательной вычитки и проверки. Даже красивый и на первый взгляд правдоподобный текст может оказаться недостоверным или вообще бессмысленным. Причина — так называемое «галлю- цинирование ИИ»: не сумев найти достаточно информации для решения поставленной задачи, нейросеть начинает додумывать факты, события, даты, именг) людей и т. п. По этой причине не стоит использовать ИИ для фактчекинга. Если сгенерированный текст необходим для работы, учебы, или есть другие причины для высоких требований к достовер- ности — все ключевые моменты следует пере- проверить в надежных источниках. Особенность ChatGPT — чрезмерная многословность. Так, при генерировании ответа он может вставить в текст вопрос, заданный пользователем, с небольшой трансформацией для чита- 59
ГЛАВА 5. маш персональный гид по текстовым чат-Ботам ОРТ бельности. Это касается как больших, так и маленьких материалов типа статей в один-два абзаца. Также в сгенерированных текстах иногда встречаются лишние речевые обороты, раздутые фразы, слова-паразиты и прочий «мусор». И если в публицистических или художественных материалах это может быть не так критично, то для CEO-текстов такое недопустимо. Как отмечалось выше, в нейросети EhatCPT реализована са- моцензура: она не позволяет генерировать тексты на противоза- конные, аморальные и прочие запрещенные темы. Иногда это мешает созданию даже вполне безобидных материалов: например, просьба написать советы на финансовую тему может оказаться нереализуемой, если чат-бот решит, что данные будут использо- ваны в мошеннических целях. Справиться с этой проблемой иногда помогает хитрость: нужно сформулировать запрос таким образом, как будто сгенерированный текст будет использован для выдуманной истории — например, в рамках детективного рассказа. Однако подобные уловки сра- батывают не всегда, в таких случаях придется проявить особую креативность. Не всегда сгенерированные тексты уникальны. Нейросеть берет информацию из собственной базы данных и открытых источников: не исключено, что в предложенный сюжет любовного рассказа или сценарий мультфильма попадут детали, уже использовавши- еся в других произведениях и защищенные авторским правом. Поэтому лучше лишний раз перепроверить материал в сервисах контроля уникальности, чтобы избежать непредвиденных непри- ятностей и разбирательств с правообладателями. Регистрацияэ подключение из России Нейросеть EhatCPT находится по адресу: https://chatgpt.com. На момент написания книги она недоступна из России, но про блема решается с помощью VPN. Можно установить на компьютер специализированное ПО для обхода блокировок. В Интернете есть платные и бесплатные зо
ПБЩИР СВЕДЕНИЯ И принципы pdhuFbl ChatGPT версии: платный вариант более функционален, но для работы с чат-ботом EhatGPT достаточно и бесплатного VPN. Обойтись без дополнительного ПО можно, воспользовавшись браузером со встроенным VPN — например, Opera. По умолчанию он отключен; для активации нужно перейти в настройки браузера, открыть раздел «Возможности» и перевести соответствующий переключатель в рабочее положение (рис. 2.3). Q Настройки Поиск настроек Основные Безопасность Браузер VPN I включить VPN [ь-одрооиее Просматривайте страницы с помощью VPN. чтобы третьи лица не могли вас отслежщ пь. VPN подключается через серверы по всему миру, поэтому это может повлиять на скорость соединения и отображение некоторых страниц и сервисов Подключаться к сети VPN при запуске браузера Включить поисковые системы по умолчанию в обход VPN «D Вклочить вмутремиме сайты в обход VPN Управление долсянительными правилами обхода VPN ► Рис. 2 3. Включение VPN в 1рвга После этого перед адресной строкой браузера появится значок VPNI. Щелкните по нему мышью, и откроется окно для включения и выключения защиты от блокировок (рис. 2.4). О . 88 Экспресс-панель С СЗ '• ч Сз Новая nai Введите запрос для поиска или веб-адрес ла Рис 5 Ч. Управлвнив работой VPN Защищено Просмотр вео страниц защищен ©Европа 77.111247ЛЗ После выполнения указанных действий страница htrps://chatgpt.com станет доступной, и можно будет приступать к работе с нейросетью. 31
ГЛАВА В Баш персональный гид по текстовым чат-Ботам GPT Можно ли использовать ChatGPT без регистрации Весной 2024 года компания разработчик нейросети ChatGPT от- крыла доступ к некоторым функциям даже без предварительной регистрации. Это удобно для первого знакомства с ИИ: система позволяет «пощупать» продукт, проверить его в деле, получить первые навыки генерирования текстов, а также понять, насколько его возможности соответствуют имеющимся задачам. Чтобы начать работу с ChatGPT без регистрации, зайдите на стра- ницу https://chatgpt.com/ — откроется интерфейс, как на рис. 2.5. И ChatGPT Чем я могу помочь? ® Гклюг Q Ооосяу* G Со*м«к юобрвж*»** 0 Креяоо «шахи ччг V Паяумиъеоагг Бамш* О>прмдм cl гоадои* СМК5РТ. *ы ажмаиткь с нмммии уммкяыи и саммьммлись с мммй пплмшпй imiiinmi Рис. 2.5 Интерфейс ГпагБРТ для незарегистрированных пользователей Далее все просто: нужно ввести в текстовое поле запрос, на- жать Enter и дождаться ответа. Результат появится примерно через несколько секунд; интервал отклика зависит от сложности вопроса и объема генерируемого текста. Принцип работы в це- лом такой же, как и после авторизации. Более подробно порядок действий будет рассмотрен ниже, в разделе «Пошаговый пример создания текста». Несмотря на удобство использования нейросети ChatGPT без регистрации, у этого варианта есть несколько серьезных недостат- ков. Во первых, для неавторизованных пользователей останутся недоступными наиболее продвинутые модели и часть функцио- нала. Во-вторых, без авторизации нейросеть не сохранит исто- 32
□ Бщир сведения и принципы раьигы ChatGPT рии диалогов: все, что было сделано в текущем сеансе работы, безвозвратно пропадет после закрытия браузера. В-третьих, незарегистрированным пользователям чат-бот не разрешает за- гружать файлы. Как зарегистрироваться в нейросети ChatCPT На главной странице чат-бота нажмите ссылку «Зарегистриро- ваться», расположенную в правом верхнем углу окна (см. рис. 2.5). После этого на экране отобразится форма, как на рис. 2.6. Создать учетную запись Адрес электронной почти Продолжить У вас j же есть f-ei ная чпиь? В< йти или G Продолжить с Google я Продолжить с учетной “ записью Microsoft * Продстгжи। ь с Apple Рис. е Б Начали регистрации в нейрисети ChatGPT Система предлагает три варианта регистрации — по адресу электронной почты либо с помощью учетных записей на Google, Microsoft или Apple. На момент написания книги опти.мальный вариант — регистрация через e-mail. Но почтовый ящик должен быть зарегистрирован на зарубежном домене: российская почта (например, на rambler.ru или mail.ru) не подойдет. Далее на ука- занный адрес придет ссылка для его подтверждения, после чего будет предложено придумать пароль. зз
ГЛАВА В оаш персональный гид по текстовым чат-ботам GPT Пароль учетной записи на ChatDPT должен состоять как минимум из 12 символое^ — таково требование системы Рекомендуется включить в него строчные и заглавные буквы, а также цифры и хотя бы один специальный символ. Это повысит надежность защиты от взлома аккаун га и несанкционированного доступа. На следующем этапе нейросеть предложит ввести сведения о себе — фамилию, имя и отчество, а также дату рождения. Здесь можно ввести вымышленные данные, их достоверность никто не проверяет. После выполнения всех перечисленных действий и авториза- ции на сайте на экране отобразится интерфейс зарегистрированно- го пользователя (рис. 2.7). Здесь создаются чаты и ведутся диалоги с нейросетью, а также отображаются сгенерированные тексты. Если вы решите зарегистрироваться с помощью учетных запи- сей на Google, Microsoft или Apple, помните, что с привязанными к России аккаунтами могут возникнуть проблемы. Более простой и надежный вариант — регистрация с использованием почты. Интерфейс и инструментарий ChatGPT Все взаимодействие с ИИ ведется в окне (рис. 2.7). СГ. Q В ChitGPI Я сект 5” Ссцдаим» «асоражаым Профчыы с Июбраж***** д**уш*> • «ос Сомами* юображения ыаш /Ьсбооь у о>*Р* Что м«о* тс» Чистка старой гииткм Лаамьиы* способы получ*. Ммама к прмкмочфнм 0 Обновить пми Сообщить ChatGPT + ® лоясж Q Обоем, и Чем я могу помочь? GS Ссядиь «обрамим Й Удиви «мм Ф Дммияроаать «овражемия Бояьзм СКмСЖТ 1M9WT дспусжапь ОМ'Со* Иггчьлендуьм лдовгрм» мфорым»ы> Рис 5 7 Интерфейс зарегистрированного пользователя 34
□ Бщир сведения и принципы pdburui ChatGPT В левой части окна представлен список ранее созданных чатов. При первом открытии интерфейса он будет пустым и в даль- нейшем формируется автоматически по мере ведения диалогов и генерирования текстов. Любой чат можно удалить: для этого нужно навести на него указатель мыши, нажать кнопку «Опции» и в открывшемся меню выбрать команду «Удалить» (рис. 2.8), после чего подтвердить удаление. ChatGPT ~ @ CnatGPT Обзор GPT Сегодня Любовь у озера Опции Чю такое электрический ток Вчера Чистка старой плитки Легальные способы получен EL Поделиться с? Переименовывать “ Архивировать (5 Удалить Мишка и Зайка приключени Рис. 5.В. Удаление чата С помощью других команд этого же меню можно выполнить следующие действия с чатом: ► архивирование (чат будет скрыт из списка, но впоследствии его можно восстановить в режиме настройки нейросети, рис. 2.13); ► отправка ссылки на чат другим пользователям (она будет автоматически сгенерирована после выбора команды «По- делиться»); ► переименование (чат будет отображаться в списке под дру- гим названием). 35
ГЛАВА В оаш персональный гид ли текстовым чат-Ботам GPT В центральной части окна ведется взаимодействие с ИИ: пользователь пишет задание, нейросеть генерирует ответы. По умолчанию весь диалог ведется в одном чате. Поэтому если вы, например, сначала попросите написать любовный рассказ, а после него — сценарий комедийной пьесы, они будут следовать один за другим в общем чате, который будет в левой части окна в списке чатов. Для разноплановых заданий лучше создавать отдельные чаты: в одном будет любовный рассказ, в другом — детективный сюжет, в третьем — сценарий мультфильма, и т. д. Если вы считаете, что нейросеть полностью выполнила задание и сгенерировала каче- ственный текст, то для другой задачи создайте новый чат, щелкнув в левой части окна на позиции EhaTDPT (рис. 2.9). дэ__________ ChatGPT gg Обзор GPT Сегодня Любовь у озера Рис. 5 9 Переход в режим создания нового чата После этого на экране отобразится окно, как на рис. 2.7, в ко- тором можно давать ИИ новое задание и заводить очередной чат. Самостоятельная настройка параметров ChatGPT Чтобы максимально адаптировать нейросеть к своим потребно- стям, рекомендуется просмотреть и при необходимости отредак- тировать параметры настройки. ЗБ
□ Бщир сведения и принципы работы ChatGPT Это делается с помощью команд (Настроить ChatGPT» и «На- стройки». Они находятся в меню, которое открывается нажатием кнопки в правом верхнем углу интерфейса (рис. 2.10). ChatGPT ~ Сообщить ChatGPT Чем я могу помочь? MoxGPt (£) Обновить план Получить расширение поиска ChatGPT + ф Помех Q Обоснуй Выйти < отдать изображение Q Кратко изложи текст И Удиви меня t_ напиши код Больше Рис 5 1D. Кпманды перехода к нодтрпйкам нейродети Команда «Настроить ChatGPT» предназначена для перехода в режим персонализации ChatGPT с учетом особенностей конкрет- ного пользователя. При ее активизации на экране отображается окно, которое показано на рис. 2.1 1. С помощью данных настроек вы даете ИИ понять, с кем он имеет дело. Здесь можно указать, как к вам обращаться (напри- мер, ввести ФИО и название должности, а если отнестись к это- му с юмором — «мой повелитель» или «господин президент»), перечислить круг интересов, высказать пожелания относительно манеры общения. Если вы хотите, чтобы данные настройки при- менялись по умолчанию ко всем диалогам, активируйте опцию «Включить для новых чатов», которая находится слева внизу окна. Для сохранения введенных данных нажмите кнопку ^Со- хранить». При нажатии «Отменить» окно будет закрыто без сохранения изменений. Чтобы настроить параметры работы с нейросетью, выполните команду «Настройки» (см. рис. 2.10) — в результате отобразится окно, как на рис. 2.12. 37
ГЛАВА В чаш персональный гид пи текстовым чат-Ботам GPT Настроить ChatGPT Представьтесь, чтобы получить более персонализированные ответы 0 Как ChatGPT должен обращаться к вам? Иван Петрович Кем вы работаете? Свадебный фотограф Какими характеристиками должен обладать ChatGPT? Q Используй неформальный, свободный тон, будь непринужденным, но в то же время уверенным в себе + Поколение Z Скептический Что-нибудь еще, что ChatGPT должен знать о вас? О Я хочу выучить английский язык, а также люблю футбол, отдых на даче и советские фильмы ^2? Включить для новых чатов Отменить Рис 5 11 Персонализация нейрпгвти ЗБ
□ Бщир сведения и принципы работы ChatGPT Настройки 0 Общее Тема Система го Персонализация |Ф Речь Элементы 8 управления данными Профиль компоновщика 00 Подключенные оо приложения ® Безопасность Всегда показывать код при использовании аналитики данных Язык русский м Архивированные чаты Архивировать все чаты Удалить все чаты Управление Архивировать все Удалить все Выйти на этом устройстве Выйти Рис. 5.1Е. Настройка EhstGPT раздел «Общее» В левой части окна — перечень тематических разделов, где собраны соответствующие параметры настройки. В правой части интерфейса — содержимое текущего раздела. На рис. 2.12 показаны настройки раздела «Общее». Здесь можно выбрать тему оформления интерфейсов (по умолчанию предлага- ется «Система», также есть варианты «Светлая» и «Темная»), язык взаимодействия с ИИ (по умолчанию это английский, поддержи- вается русский и другие языки). В этом же разделе ведется работа с архивированными чатами. Переход в соответствующий режим осуществляется нажатием кнопки «Управление» (см. рис. 2.12) — в результате откроется окно, как показано на рис. 2.1 3. Здесь представлен перечень диалогов, ранее переведенных в архив. У каждого из них справа отображаются две кнопки: одна предназначена для восстановления чата на прежнем месте (он поя- вится в списке в правой части основного интерфейса, см. рис. 2.7), другая — для его окончательного удаления. Названия иконок 39
ГЛАВА ? Баш персональный гид по текстовым чат-Ботам GPT отображаются в виде всплывающих подсказок при подведении к ним указателя мы иди. Архивированные чаты Имя Дата создания О Создание изображения мяча 7 февраля 20?5 г. О Hehum Balloons: Buy Now! 19 января 2024 г. Рис В 13 РаБнта с архивированными чатами С помощью кнопок «Архивировать все» и «Удалить все» (см. рис. 2.12) можно перевести все сохраненные диалоги в архив и полностью очистить историю чатов. В каждом случае система выдает запрос на подтверждение действия. Если вы хотите получать ответы и сообщения от нейросети в речевом формате (т. е. голосом), можно настроить данный режим работы в разделе «Речь» (рис. 2.14). Настройки © Общее Д Персонализация •|И' Речь Элементы й управления данными г-. Профиль компоновщика Голос Основной язык © Воспроизвести Vale v Russian v Для достижения наилучших результатов выберите язык на котором еы ь основном говорите. Если его нет в списке, он все равно может поддерживаться посредством автоматического определения. Рис. 2 14 Настройка речевого рБщвния С помощью кнопки «Воспроизвести» можно прослушать голос, интонацию и скорость речи, которая будет звучать при общении с ИИ. Если предложенный по умолчанию вариант не устраивает, нажмите расположенную справа кнопку Vale и в открывшемся 4D
□ Бщие сведения и принципы работы ChatGPT списке выберите любое значение, после чего прослушайте ре- зультат с помощью кнопки «Воспроизвести». Можно перебрать все предложенные варианты и выбрать тот, который понравится. Язык речевого общения выбирается в раскрывающемся списке (на рис. 2.14 выбрано значение Russian). В разделе «Элементы управления данными» (рис. 2.15) можно выгрузить все чаты, а также данные своей учетной записи во внеш- ний файл для последующего сохранения на другом носителе. Настройки Удали1ь 0 Общее Улучшить модель для всех Включить > Персонализация Общие ссылки Управление 4U* Речь Элементы Экспорт данных Экспорт R управления данными Удалить учетную запись _ Профиль компоновщика Рис. Е.15. Раздрл «Элементы управление данными» После нажатия кнопки «Экспорт» и подтверждения операции нейросеть сохранит все чаты в файл и сгенерирует ссылку на него, которую отправит на указанный при регистрации электронный адрес. Ссылка будет действительна в течение суток с момента получения. Пошаговый пример создания текста С технической точки зрения процесс создания текстов с помощью нейросети EhatGPT особой сложности не представляет. Взаимо- действие с ИИ ведется в формате обычного диалога, как в любом онлайн чате. Самое главное — правильно ставить задачу, при необходимости уточнять и дополнять ее, а также понимать, что можно требовать от чат бота, а где он помочь не сможет. 41
ГЛАВА В маш персональный гид по текстовым чат-Ботам GPT Итак, попросим нейросеть написать короткий любовный рассказ из трех абзацев (рис. 2.16). Чем я могу помочь? напиши любовный рассказ из трех абзацев + ® Поиск Q Обоснуй Рис Е?.1Б Постановка задачи пи написанию рассказа Нажимаем клавишу Enter или кнопку со стрелочкой в правой части окна (рис. 2.17). Напиши любовный рассказ из трех абацев Иван Дорошенко стоял > окна, наблюдая за снегопадом который нежно укрывал город белым покрывалом Вечер обещал быть тихим, но его сердце трепетало от странною волнения. Несколько дней назад он познакомился с Еленой — учительницей из соседней школы. Ее улыбка была как теплив солнце среди зимнего колода, а голос— мелодия, которая не покидала его мысли. Сегодня они встретились снова. На небольшом катке у реки Елена смеялась скользя по льду, а Иван, неуклюже пытаясь удержать равновесие, не мот оторвать от нее взгляда. -Ты серьезный детектив, но на льду словно ребенок!» — поддразнила она его протягивая руку. Их палоцы соприкоснулись, и этот невинный жест пробудил в нем давно забытое чувство легкости и счастья. Когда эни уходили с катка снег продолжал падать, мягко ложась на их волосы и плечи. Иван задержал шаг и обернулся к Елене. «Я никогда не думал, чго смогу почувствовать такое снова», — тихо признался сн. Елена лишо улыбнулась и коснулась его руки. «Иногда счастье приходит, когда его совсем не ждешь», — прошептала она И в этот момент Иван понял, что его сердце больше не принадлежит только улицам и тайнам города — в нем нашлось место для любви. СЗ” <53 Л Рис Е 17 Рассказ, сгенерированный нейрг-гетью ChatGPT Обратите внимание — ИИ сам додумал детали, которые пока- зались ему существенными, но не были отражены в изначальной постановке задачи: ► главным героям рассказа присвоены имена (при этом муж- чине нейросеть придумала фамилию, а женщине — нег); ЧЕ
□ Бщир сведения и принципы работы ChatGPT ► события происходят в зимнее время года на катке; ► есть информация о профессиях героев: мужчина детектив, а женщина — учительница в школе. Откорректируем задачу и попросим нейросеть изменить рассказ так, чтобы события происходили в летнее время года (рис. 2.18). измени рассказ так. чтобы события происходили летом Иван Дорошенко стоял у окна, наблюдая за теплым летним вечером, который окунал город в мягкие оранжевые оттенки заката В воздухе витал аромат цветущих лип, а легкий ветерок доносил голоса прохожих. Несколько дней назад он встретил Елену — учительницу из соседней школы. Ее смех был как журчание ручья в жаркий день, а взгляд — как освежающая тень в зной. Сегодня они гуляли вдоль реки, где вода переливалась солнечными бликами. Елена смеялась, рассказывая забавные истории о своих учениках, а Иван, обычно сдержанный и серьезный, ловил себя на том, что смеется вместе с ней. В какой-то момент она предложила взять напрокат лодку, и они оказались посреди тихой заводи где Иван, глядя на отражение заката в ее глазах, ощутил непреодолимое желание остановить время. Когда они вернулись к берегу, небо стало густо-синим, а первые звезды зажглись над городом. Иван остановился и посмотрел на Елену. «Я никогда не думал, что лето может быть таким особенным5». — признался он, протягивая ей руку Елена улыбнулась и, нежно касаясь его ладони, сказала: «Счастье всегда рядом, просто иногда нужно открыть для него сердце». Иван понял, что с этого момента его жизнь изменилась навсегда. Рис 5 LR Нейросеть изменило врвмя событий в рассказв ИИ неплохо переделал текст под летнюю пору года, но при этом самовольно убрал упоминание о профессии мужчины, а вот о женщине эту информацию почему то оставил. Это то, о чем мы уже говорили ранее: нейросеть может без види.мых причин добавлять или удалять какие-либо сведения. И если подобные моменты принципиально важны, необходимо внимательно вы- читывать материал и либо уточнять их каждый раз, либо вносить самостоятельно. Теперь попросим нейросеть дополнить рассказ информацией о возрасте героев (рис. 2.19). чз
ГЛАВА 5. маш персональный гид по текстовым чат-Ботам GPT добавь информацию о возрасте героев Иван Дорошенко стоял у окна, наблюдая за теплым летним вечером, который окунал город в мягкие оранжевые оттенки заката. В свои сорок два он видел немало, но сейчас чувствовал себя словно юноша. В воздухе витал аромат цветущих лип. а легкий ветерок доносил голоса прохожих. Несколько дней назад он встретил Елену— тридцатипятилетнюю учительницу из соседней школы. Ее смех был как журчание ручья в жаркий день, а взгляд— как освежающая тень в зной. Сегодня они гуляли едоль реки, где вода переливалась солнечными бликами. Елена смеялась, рассказывая забавные истории о своих учениках, а Иван, обычно сдержанный и серьезный, ловил себя на том, что смеется вместе с ней. В какой-то момент она предложила взять напрокат лодку, и они оказались посреди тихой заводи, где Иван, глядя на огражение заката в ее глазах, ощутил непреодолимое желание остановить время. Когда они вернулись к берету, небо стало густо-синим, а первые звезды зажглись над городом. Иван остановился и посмотрел на Елену. "Я никогда не думал что лето может быть таким особенным», — признался он, протягивая ей руку. Елена улыбнулась и, нежно касаясь его ладони, сказала: -«Счастье всегда рядом, просто иногда нужно открыть для него сердце*. Иван понял, что даже после сорока жизнь способна подарить светлую и неожиданную любовь. б1 (6 & Рис. 2 19 Рассказ дополнен информацией о возрасте героев Помимо сведений о возрасте, ИИ неплохо и логично допол- нил концовку, которая обрела более широкий смысл. Нейросеть решила самостоятельно определить возраст героев (мужчине 42 года, женщине 35 лет), руководствуясь распространенным мнением о том, что мужчина должен быть на несколько лет старше женщины. Попробуем добавить в рассказ немного пикантности и попро- сим нейросеть дополнить его информацией о том. что у каждого из главных героев есть своя семья. ИИ достаточно корректно справился с такой задачей (рис. 2.20). Помимо выполнения основной задачи, нейросеть вновь вспом- нила о роде деятельности главного героя — службе в полиции. Она самостоятельно решила, что у мужчины есть десятилетний сын, а у женщины — дочь школьница, но ее возраст не указала. При этом о жене главного героя и о муже героини ничего не сказано. Попробуем восполнить этот пробел и поставим соответствующую задачу (рис. 2.21). чч
□ Бщир СВЕДЕНИЯ и принципы pdbuFbl ChatGPT измени рассказ так. как будто у главных геооев есть свои семьи Иван Дорошенко стоял у окна, наблюдая, как теплый летний вечер погружается в мягкую тишину. Ему было сорок два, и жизнь давно стала размеренной — служба в полиции, заботы о десятилетнем сыне и привычные маршруты по городу. Но несколько дней назад он встретил Елену — тридцатипятилегнюю учительницу из соседней школы, которая тоже жила в ритме будней между уроками и семьей. Их разговоры начались случайно, но переросли в теплую дружбу, которая становилась все ближе с каждым днем Сегодня они гуляли вдоль реки после мероприятия, где встречались их дети. Елена рассказывала, как её дочь недавно выиграла школьный конкурс, а Иван смеялся, вспоминая проделки своего сына. В какой-тс момент они присели на лавочку у берега, слушая плеск ьодьс «Иногда мне кажекя, что взрослые забывают, как это — просто наслаждаться моментом». — сказала Елена, глядя на тихую реку Иван кивнул. «Да, мы слишком заняты тем, чтобы все было правильно и по расписанию' Когда ьечер опустился на город они неспешно вернулись к парковке Иван задержался на мгновение и посмотрел на Елену. «Спасибо за этот вечер», — тихо сказал он Елена улыбнулась. «Иногда такие встречи дают больше сил, чем мы думаем». Они знали, что их жизни принадлежат их семьям, но этот вечер останется для них светлым воспоминанием — как напоминание о простом и чистом понимании между двумя людьми. ф (5 0 9 £ Рис. 5 20 Д-злплнение рассказа информацией □ срмьях героев дополни рассказ информацией о жене Ивана и муже Елены Иван Дорошенко стоял у окна, наблюдая, как теплый летний вечер погружается в мягкую тишину. Ему было сорок два. и жизнь давно стала размеренной. Его жена Ольга работала в больнице медсестрой и часто задерживалась на сменах. Они вместе уже двенадцать лет. воспитали десятилетнего сына Андрея и привыкли к пс вседневным заботам, где чувства порой терялись за рутиной Несколько дней назад Иван встретил Елену — тридцатипятилетнюю учительницу из соседней школы, чья жизнь гоже была полной хлопот. Ее муж Виктор инженер на крупном заводе, постоянно пропадал на работе или ездил в командировки. Их общение началось случайно но вскоре превратилось ь редкие моменты, которые казались глотком свежего создуха. Сегодня они гуляли вдоль реки после школьного мероприятия, где выступали их дети. Елена с улыбкой рассказывала, как ее восьми ле г няя дочь Катя недавно выучила песню для праздника а Иван смеялся, вспоминая, как Андрей пытался сделатв вид, что ему скучно, хотя на самом деле старателвне готовился. «Виктор не смог прийти, снова работа», — с лёгкой грустью заметила Елена. Иван понимал ее чувство: Ольга тоже сегодня была на смене Когда вечер опустился на город они вернулись к парковке Иван задержался на мгновение и посмотрел на Елену. «Спасибо за лог вечер», — тихо сказал он. Елена ответила теплой улыбкой. «Такие встречи напоминают, что в жизни есть место простым радостям» Они знали, что их жизни принадлежат их семьям и ни один из них не хотел менять эту реальность. Но этот вечер останется для них светлым воспоминанием о том, как понимание между двумя людьми может стать тихой поддержкой в круговороте будней Ф (3 (й Q Рис. 2.21. Дополненная аррсия рассказа 45
ГЛАВА Е? маш персональный гид пи текстовым чат-Ботам GPT Помимо выполнения поставленной задачи, нейросеть по- пыталась «оживить» рассказ, добавив в него дополнительную информацию о детях главных героев, хотя изначально этого от нее нс требовалось. Но доработка получилась достаточно органичной и хорошо вписалась в канву произведения. Гак можно дополнять текст сколь угодно раз, меняя факты, обстоятельства, события, дорабатывая и изменяя сюжет, коррек- тируя главную идею, и т. д. И небольшой рассказ вполне может трансформироваться в развернутое эссе или повесть. Теперь обратим внимание на небольшой нюанс: в списке чатов, который отображается в левой части окна, наш рассказ показан под названием «Любовь на катке» (рис. 2.22). ChatGPT ChatGPT gg Обзор GPT Сегодня Любовь на катке Любовь у озера Что такое электрический тек Рис. Е.ЕН. Название рассказа в списке чатов Так по умолчанию озаглавила его нейросеть, руководству- ясь гем, что в первоначальной версии произведения главные герои познакомились в зимнее время года именно на катке. В принципе, чат можно так и оставить под этим именем, но ло- гичнее все же переименовать его сообразно сюжету. Для этого выполним команду «Опции» — «Переименовывать» (см. рис. 2.8) и с клавиатуры введем новое название — предположим, «Летняя встреча» (рис. 2.23). ЧБ
Знакомимся с нейросетью YandexCPT Q й ChatGPT ~ ChatGPT gg Обзор GPT Сегодня Любовь у озера Что такое электрический ток Рис. 5.53 Переименньание ната При следующем сеансе по умолчанию открыва- ется последний чат. И даже если задание будет другим, переписка продолжится под недавно написанной статьей. Поэтому при каждом оче- редном сеансе с другим заданием не забыиайте открывать новый чат. Знакомимся с нейросетью YandexCPT Эта нейросеть — один из главных конкурентов рассмотренной выше ChatGPT. Ее преимущество в том. что она создана россий- скими разработчиками: это сразу снимает все ограничения для пользователей из России. Чтобы работать с YandexGPT, не нужно искать обходные пути вроде VPN: можно сразу приступать к гене- рированию текстов на любые темы, не запрещенные действующим законодательством, а также общепринятыми нормами морали и здравого смысла. Работать с нейросетью YandexGPT могут зарегистрированные и незарегистрированные пользователи. Далее рассмотрим оба варианта. 47
ГЛАВА В маш персональный гид гш текстовым чат-Ботам LPT Использование YandexCPT без регистрации Это самый простой вариант, который предусматривает работу с известным помощником «АЛИСОЙ». Он доступен всем пользо- вателям без исключения. Все, что нужно для работы с YandexDPT без регистрации, — это выход в Интернет на любом браузере, который поддерживает сервисы «Яндекса» (например, Opera или Google Chrome). Это удобно для получения первых навыков использования текстовой нейросети. Вы можете сами сгенерировать неслож- ный текст по предварительно составленному заданию. Смело экспериментируйте, ставьте ИИ любые задачи, корректируйте и уточняйте запросы до тех пор, пока не получите приемлемый результат. Это поможет обрести необходимый минимум знаний и опыта для того, чтобы вывести свое сотрудничество с нейросе- тью на более высокий уровень. Для использования YandexC^T без регисграции зайдите на глав- ную страницу «Яндекса» и нажмите кнопку вызова помощника (рис. 2.24). « -» С -7 yandex.by G Войти <Y Установите Яндекс Браузер Найдётся всё -5’ G 3 USD 3 38 EUR 3 49 Минск Рис 2 24. Кнопка аызива помощника «Алиса» на главной странице «Яндекса» ча
Знакомимся с нейросетью YandexCPT Если по каким-то причинам кнопка не отображается (это может происходить, например, при использовании некоторых версий браузера Mozilla Firefox), зайдите на «Яндекс» с помощью другого интернет-обозревателя. В открывшемся меню выберите пункт «Чат с Алисой YaGPT» (рис. 2.25). Войти ------ Запусти Чем я могу помочь? Где наушники по лучшей цене** Погода на выходных 3.4S Напишите мне Игры с Алисой Рис. 5 25. Переход г режим работы с текстовым чат-ботом Откроется интерфейс, в котором осуществляются все дей- ствия по написанию и редактированию текстового контента. Чтобы поставить задачу, введите ее в текстовом поле и нажмите кнопку со стрелкой или клавишу Enter. Для примера попросим нейросеть YandBXCPT написать любовный рассказ на три абзаца (рис. 2.26). чэ
ГЛАВА В Ваш персональный гид гш текстовым чат-Ботам GPT Оформить Про Войти Со 1дать новый чат Войдите в аккаунт Яндекса, чтобы создавать новые чаты и хранить историю запросов и ответов Войти Напиши любовный оассказ на три абзаца вЗ □ Свернуть □ © V Аписа старается, но может ошибаться — проверяйте важное. Подробнее Рис. В BE Постановка задачи для VandexGPT Подобные задания нейросеть YandexGPT выполняет за не- сколько секунд. Результат представлен на рис. 2.27. Напиши любовный рассказ на гри абзаца (Э В одном маленьком городке жила девушка по имени Мария. Она была красива, добра и умна. Однажды Мария встретила молодого человека по имени Иван. Они сразу почувствовали взаимное притяжение и начали проводить много времени вместе. Иван и Мария стали неразлучными друзьями. Они гуляли по городу, ходили и кино и обсуждали свои мечты и планы на будущее Вскоре их дружба переросла в нечто большее — они поняли, что любят друг друга. Мария и Иван решили быть вместе навсегда. Они поженились и прожили долгую и счастливую жизнь, полную любви и радости. Рис. 5.27 Рассказ, сгенерированный нейросетью YanPexGPT с помощником «Алиса» Как видно на рис. 2.27, произведение получилось достаточно простым, коротким и в некоторой степени банальным. Нейро- сеть самостоятельно придумала имена героев, сюжетную линию и некоторые обстоятельства. 5D
Знакомимся с нЕйрогвтью YandexCPT Писать подобные художественные тексты с помощью Алисы не очень удобно Нейросеть не всегда понимает, что от нее хочет пользова- тель. и может не совсем адекватно реагировать на уточнения. Например, если попросить ее добавить информацию о времени года, она ответит что-то вроде «можно написать, что дей- ствие происходит летом, а герои купаются в реке и ходят за грибами». А вот с заданиями вроде «напиши историю бренда <Мерсе- дес», «напиши школьное сочинение о творчестве Пушкина» или «напиши школьное сочинение о творчестве Пушкина» Алиса справляется в целом неплохо: здесь не нужно ничего додумы- вать, достаточно взять информацию из базы данных или других источников. Использование YandexDPT без регистрации не позволяет со- здавать новые чаты и сохранять историю диалогов. Все общение с нейросетью будет происходить в одном окне: за первым заданием отображается второе, за ним третье и т. д. Если вы хотите сначала написать рассказ, затем получить текст об истории бренда, а после этого — школьное сочинение, все эти материалы будут находиться в одном чате. По окончании сеанса работы они утрачиваются. Но вы можете удалить их самостоятельно — например, чтобы следующий диалог в чате велся с чистого листа. Для этого нужно навести указатель мыши на текст и щелкнуть на иконке с тремя точками, после чего в открывшемся меню выбрать команду ^Уда- лить» (рис. 2.28). В этом же меню можно просмотреть источники, которыми пользовалась нейросеть при написании текста (на рис. 2.28 это сайт www.drive2.ru). Также незарегистрированным пользователям недоступны часть функционала и многие инструменты. Например, нельзя загружать файлы, что бывает необходимо для рерайта. 51
ГЛАВА В оаш персональный гид пп текстовым чат-ботам GPT В 1926 году г Benz & Cie. В автомобиле, решено объс & Cie. 4- Новый чат На основе: Р> iac 4с □ www.drive2.ru об О’ О' Рис В.ЕЯ. Удаление диалога из чата Таким образом, незарегистрированные пользователи могут генерировать тексты с помощью нейросети YandexCPT, но это будут достаточно простые материалы, которые нужно серьезно дорабаты ваты Возможности YandExGPT для зарегистрированных пользователей Чтобы воспользоваться расширенным функционалом и до пол нительными возможностями нейросети VandEXCPT, необходимо иметь регистрацию «Яндекс ID». «Яндекс ID» — это единый аккаунт, с помощью которого могут авторизоваться на всех сер- висах «Яндекса» (электронная почта, диск для хранения информации, облачные ресурсы и пр.). Он присваивается бесплатно; для этого достаточно пройти стандартную регистрацию на «Яндексе» с идентификацией пользователя. Подробно рассматривать процесс регистрации мы не будем: он прост, интуитивно понятен и осуществляется в течение несколь- ких минут. Необходимо на главной странице <-Яндекса» нажать SB
Знакомимся с нейросетью YandBxGPT кнопку «Войти» (она находится в правом верхнем углу), после чего в открывшемся окне щелкнуть «Создать ID» и выбрать пункт <Для себя» (возможен также вариант <Для ребенка», но в контексте нашей темы это неактуально). Дальнейшие действия выполняются в пошаговом режиме согласно указаниям на экране. Для доступа к нейросети YandExCPT необходимо автори- зоваться на «Яндексе» и перейти в облачный сервис. Это мож- но сделать по ссылке https://yandex.doud/ru либо щелчком мыши на позиции Yandex Cloud в списке сервисов для бизнеса (рис. 2.29). Книги Книжные бестселлеры. комиксы и аудиокниги — удобно читать и слушать Скачать ф « Переводчик Автоматический перевод текстов н веб-страниц Скачать ф« Яндекс ID Единый аккаунт для Яндекса м бы- строго входа на другие сайты Для бизнеса Дирек г Контекстная реклама Скачать ф йп AppMetnca Универсальная платформа для мар- кетинга и аналитики приложений Скачать фй Yandex Cloud Облачная платформа для ваших проектов Г Такси для бизнеса Оттммкхируйте вашл расходы на корпоративна поездки Скачать zgi Корпоративное питание СЙГ Доставка обедов, оплата в кафо или микромаркеты с едой а вашем офисе Драйв для бизнеса Каршеримг вместо корпоративного автопарка Рис 2.S3. Пеоехсд в режим работы с. -..Блачными сервисами «Яндекса» В открывшемся окне щелкните на ссылке «Консоль» в правом верхнем углу (рис. 2.30) для доступа к сервисам Yandex Cloud. > С |'wm) yandexxloud/ru Yandex О Cloud Q Связаться снами Сервисы Решения Почему Yandex Cloud Ресурсы Тарифы Документация Блог Рис 2 3D. Пврвход в режим работы с консолью 53
ГЛАВА В маш персональный гид гш текстовым чат-ботам GPT После этого в левой части интерфейса выберите раздел «Все сервисы», а затем в подразделе <<Al Studio» щелкните на позиции УапОвхБРТ API (рис. 2.31). Yandex Cloud Q Поиск Иэорвиное Уведомления (?) Центр поддержки Рис В 31 Переход з режим работы с нейросетью YandexGPT После этого на экране отобразится интерфейс, изображен- ный на рис. 2.32. Здесь ведется работа с нейросетями «Яндекса», в числе которых не только УапйехБРТ для работы с текстами, но и, например, сервис для генерирования изображений, с ко- торым мы познакомимся в следующей главе. Сейчас в данном интерфейсе нас интересуют две позиции — «Чат с YandexGPT» и «Промт-режим с YandexGPT». Оба раздела предназначены для генерирования текстов с помощью YandexCPT; различаются они только некоторым функционалом и подходом к работе. Далее рассмотрим каж- дый из них. 54
Знакомимся с нЕЙросвтью YandexCPT Рис. Е 35 Разделы для раБаты с YandaxCPT ПРИМЕЧАНИЕ Неопытному пользователю интерфейсы Yandex Cloud могут показаться сложными, а структура — не совсем непонятной и очевидной. Здесь надо понимать, что облачный сервис «Яндекса» соз- дан в первую очередь для бизнеса, и включает в себя множество инструментов для разработки, проектирования, генерирования и решения иных аналогичных задач. Однако нас интере- сует только нейросеть для работы с текстами УапйвхБРТ. а ее функционал и инструментарий просты и понятны. Поэтому даже у малоопытных рядовых пользователей процесс генерации текстов не представит никакой сложности. Основные принципы работы во многом аналогичны написа- нию текстов с помощью ChatGPT. Поэтому мы не будем подробно вдаваться в тонкости, а рассмотрим основные приемы и методы работы с YandBxGPT. 55
ГЛАВА В Ваш персональный гид по текстовым чат-Ботам GPT Работа с YandExDPT в режиме чата Интерфейс для работы в режиме чата показан на рис. 2.32. Не- обходимо ввести текстовый запрос (задание) и нажать клавишу Enter либо кнопку в правой части поля. На рис. 2.33 показан пример небольшого детективного рассказа, сгенерированного YandexGPT. На момент написания книги функционал YandexGPT не пред- усматривает сохранение истории диалогов для последующего просмотра или редактирования. Поэтому, если сгенерированный текст устраивает, скопируйте его в буфер обмена с помощью кнопки «Скопировать ответ» (см. рис. 2.33) и сохраните в от- дельном файле. напиши детек!ивный рассказ на три абзаца Загадочное исчезновение В небольшом городке произошло загадочное событие: пропал известный учёный, доктор Ричардсон Полиция начала расследование, но не смогла найти никаких улик или свидетелей. Все друзья и коллеги доктора были в недоумении и не могли понять, что могло произой ги. Детектив Джон Смит решил взяться за это дело Он начал с опроса всех знакомых и коллег поопавшего учено, о Вскоре он обнаруж ил. ч то у доктора Ричардсона был конфликт с одним из его студентов, который недавно провалил экзамен. Детектив решил поговорить с этим студентом, и тот признался, что а идел доктора в день исчезновения. Студент рассказал, что доктор был очень расстроен и ушел в неизвестном направлении. После долгих поисков детектив нашёл доктора Ричардсона в заброшенном здании на окраине города Оказалось, что учёный просто хотел побыть в одиночестве и подумать о своих проблемах. Он был очень рад. что его нашли, и благодарен детективу за помощь. Скопировать ответ Рис 5.33. Рассказ, написанный нейросетью YandexGPT в режиме чата Если же текст требует доработки, необходимо ввести уточ- няющий запрос по аналогии с тем, как это делается в EhatGPT. Попросим ИИ добавить в рассказ информацию о времени года, в течение которого происходят события (рис. 2.34). 5Б
Знакомимся с нейросетью YandexCPT Чат с YandexGPT 4 Pro С Очистить добавье этот текст информацию о времени года Загадочное исчезновение В небольшом городке произошло загадочное событие: пропал известный ученый, доктор Ричардсон. Это случилось осенью, когда воздух становился прохладным и прозрачным а листья на деревьях начинали менять свой цвет с зелёного на жёлтый и красный. Полиция начала расследование, но не смогла найти никаких улик или свидетелей Все друзья и колле! и доктора были в недоумении и не могли понять, что МО'ЛО произойти Детектив Джон С мит решил взяться за это дело. Он начал с опроса всех знакомых и коллег пропавшего учёного. Вскоре он обнаружил, что у доктора Ричардсона был конфликт с одним из его студентов который недавно провалил экзамен. Детектив решил поговорить с этим студентом, и тот признался, что видел доктора в день исчезновения. Студент рассказал, что доктор был очень расстроен и ушел в неизвест ном направлении. После долгих поисков детектив нашёл доктора Ричардсона в заброшенном здании на окраине города, Оказалось, что ученый просто хотел побыть в одиночестве и подумать о своих проблемах. Он был очень рад. что его нашли, и благодарен детективу за помощь. Доктоо Ричардсон вернулся домой, где его ждали семья и друзья, готовые поддержать его в любой ситуации. (9 Скопировать ответ Рис. 5 34. Доработка текста в соответствии с уточняющим запросам Как видно на рисунке, в первом абзаце появилась информация о том, что события разворачиваются осенью. Обратите внимание: нейросеть корректно восприняла требование о доработке — в от- личие от рассмотренной выше Алисы, которая не всегда адекватно дорабатывает художественные и некоторые другие тексты. Все диалоги при работе в режиме чата YandexGPT ведутся в од- ном и том же интерфейсе — по аналогии с АЛИСОЙ. Это не совсем удобно, но на момент написания книги разделения на отдельные чаты не предусмотрено. Если вы считаете, что работа с текстом завершена, скопируйте его в буфер обмена, сохраните в отдельном файле, а затем нажмите кнопку (Очистить», которая находится справа вверху рабочего окна (см. рис. 2.34). После этого окно будет освобождено для нового диалога. Хотя нейросеть YandexGPT заточена в первую очередь под нужды бизнеса, она неплохо справляется с творческими задани- ями типа написания небольших рассказов, сценариев для пьес 57
ГЛАВА 5 Ваш персональный гид по текстовым чат-Бстам GPT и мультфильмов, школьных сочинений и т. д. С ее помощью можно придумывать названия брендов, фирменные слоганы (рис. 2.35), шаблоны резюме, разрабатывать концепции развития. придумай с логан фирмы по производству аккумуляторов Слоган фирмы по производству аккумуляторов • «Энергия в каждой поездке!» • «С нашими аккумуляторами вы сможете всё!» • «Аккумуляторы для тех. кто всегда в движении!» С? Скопировать о! ает Рис 5.35. Нейросеть YandexGPT придумала фирменные слзганы Нейросеть YandPXGPT в режиме чата подходит для суммиро- вания и анализа текстов, составления информационных рассылок, описаний товаров для каталожных страниц, а также решения иных задач, актуальных как для бизнеса, так и для рядовых обывателей. Работа с YandExCPT в промт-режиме Этот режим предусматривает более гибкую постановку задачи и позволяет максимально адаптировать нейросеть к написанию конкретного текста с учетом всех предъявляемых к нему требо- ваний. Интерфейс показан на рис. 2.36. Здесь выполняются все действия по формулированию задания, после чего нейросеть генерирует ответ. В поле «Модель» из раскрывающегося списка можно выбрать модель нейросети YandexGPT, к которой необходимо обратиться. Соблюдается следующая закономерность: чем новее и функци опальнее модель, тем более точные ответы она дает на запросы любой сложности, но при этом на подготовку текста уходит боль- ше времени. Параметр «Температура» позволяет задать вариативность сге- нерированного текста и степень креативности при его подготов 5В
Знакомимся с нейросетью YandexGPT кс. Чем ближе значение к 1, тем более развернутым будет ответ, но при этом он может содержать много вымышленной и непод- твержденной информации. По умолчанию параметр установлен в положение 0,3: это стандартные требования к вариативности результата. Псомт-режим YandexGPT Al Studio Foundation Models Q Оеераиге Д Al Playground {Q Чат c YandexGPT 4 Pro □ Промт-режим YandexGPT © YandcxART Мониторинг YY Избранное 4Д Уведомления © Центр поддержки © Настройки Настройки л Модель © Температура © Инструкции © Л Введите инструкцию Запрос © Введите запрос Использовано Этокенов © YandexGPT 4 Pro • RC Узнать отает Рис ? ЗБ . Промт-режим YandexGPT В поле «Запрос» пользователь формулирует задачу — напри- мер, «напиши детективный рассказ на пять абзацев», «придумай сценарий детской пьесы про Новый год», «придумай три слога- на для завода по выпуску автошин» и т. п. Иначе говоря, здесь следует четко и понятно объяснить нейросети, что именно она должна выполнить. 59
ГЛАВА 2. йаш персональный гид пи текстовым чат-Ботам GPT Поле «Инструкции» предназначено для дополнительной конкретизации поставленного задания. Здесь можно написать свои пожелания по структуре или подаче материала, например: тиши в свободном стиле с элементами юмора», «в тексте долж- но быть два маркированных списка и три подзаголовка», и т. п. Чтобы запустить процесс генерации текста, нужно нажать кнопку ^Узнать ответ» внизу интерфейса. Результат отобразится в правой части окна. На рис. 2.37 показан сценарий рекламного видеоролика для продвижения аккумуляторов Varta, сгенериро- ванный YandexCP’ в промт-режиме. Если полученный результат устраивает, скопируйте его в буфер обмена с помощью кнопки «Скопировать ответ», после чего со- храните в отдельном файле. При необходимости можно получить другой вариант текста: для этого предназначена кнопка «Ответь иначе». Кроме этого, есть возможность уточнения и корректировки задания в соответствующих полях левой части интерфейса: после внесения изменений в задачу надо вновь нажать кнопку «Узнать ответ». Новый текст отобразится в правой части окна. Промт-режим YandexGPT Настройки л Моды* Ф тагкЗеябРТ 4 Pro. PC v Температура ф 03 0 1 Инструкции ф л пиши • мейтрадыюмстмм Запросф Напиши сценарии рекла»*юсо ролика про атхумупяторы Varu Ислольэоеано ЗЗтоммов ф Уьчать сияет ♦. YjrKfecGPTAPt Ml® Названые ролмск -Varta энергия д м хюж, Жанр; Ш4форматнамый.с злеыеыпмидвмонстрацм*. Хронометраж 1 ммиута Целевая аудитория, аягомобмтялм. владельца бытояой тахмяем и злектроммем. Сценарий: ОпмрыааюсцсО tadu логотип Varta на фоне изображения аккумулятора Голос кафром-«Varta — это надежные аяхумуяяторы. которые обесле*еивают стабильную работу вашей техники-. Смена кадр* автомобиле, который заводится с первого рам благодаря аккумулятору VBrx а. Литое м кадром. -Аккумуляторы Varta созданы джа того, чтобы обеслеостъ бесперебойную работу вашего автомобиля». Смена кафм бы томя теюяыа (малрммер. холодильник). котскмя работает б» сбоев благодаря аккумулятору Varta. Галсе м кадром «С аккумуляторами Varta ваша техника будет работать как новая» Смена кадра изображение аккумулятора Varta к рутным гишюм. Лиях м кадром3 4!ыб««ой1* аккумуляторы Varta и наслаждайтесь стабильной работой вашей теюткм*» Закрыв вскцьФ кафре логотип Varta и кокгактая нмформация. Этот сиемарый прядггавляет собой яишв один иэ во змомона вэомамтюо реккамеэго рояыка про аккумуляторы Varta, вы можете добавить или изменить некоторые зяемемты в соответствии с вммыи предпочтишяыы (9 Сиопкюяатьотжт 0 Ответь иначе ф Код Рис. 5 37 Текст сгенерированный а прпмт-рвжимв YandexGPT
ГЛАВА 3 КАК СТАТЬ ХУДОЖНИКОМ, ИЛИ УЧИМСЯ РИСОВАТЬ С ПОМОЩЬЮ ИИ Создание графики — одно из самых перспективных и востре- бованных направлений использования ИИ. Ранее мы уже отмечали, что нейросеть не поможет в написании картин-шедев- ров, но решать с ее помощью текущие задачи по генерированию графического контента вполне реально. Сегодня есть множество нейросетей, разработанных для созда- ния графики разного назначения и сложности. В целом порядок работы с ними прост и понятен, специальное обучение не требует- ся, предлагаемый инструментарий очевиден и его использование не вызывает сложностей. Это позволяет генерировать картинки пользователям, далеким от современных ГГ-технологий. Далее рассмотрим несколько популярных нейросетей, с по- мощью которых можно легко и быстро создавать графический контент. Нейросеть Artguru - просто и со вкусом Ее можно использовать для создания портретов, рисунков, ло- готипов и других изображений, а также для их редактирования, улучшения качества и пр. Б1
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ Условия использования Нейросеть Artguru находится в свободном доступе по адресу: https://www.artguru.ai/ru/. Поддерживается несколько языков, по умолчанию включен английский. Для русификации интер- фейсов и инструментов нужно выбрать русский язык из раскры- вающегося списка, который находится слева в подвале главной страницы (рис. 3.1). Deutsch Franqais Italiano Portugues Bahasa Indonesia ® English Рис. 3.1. Русификация нейрпсети Artguru После этого стартовый интерфейс нейросети Artguru станет русскоязычным (рис. 3.2). Нейросеть рисует по словам или фото (»**———О о—сЮСлЭЯ1 ГШЖК й-и-и ttoc*> ЮМКМ СИ»' »-«««-, X) СуОй'ДЛ а>О1 Рис З.Е? Нейросетв Artguru БЕ
Нейросеть Artguru — прости и си вкусом Этот ИИ доступен бесплатно и без регистрации. Есть опреде- ленные ограничения по функционалу и количеству генерируемых картинок, но в целом возможностей бесплатной версии достаточно для решения многих задач частного и коммерческого характера. Также у Artguru есть платная подписка. Она открывает доступ к дополнительным инструментам и предоставляет расширен- ные возможности для создания и редактирования графического контента. Для работы с картинками и фотографиями нужно в главном окне выбрать режим «Изображение» (см. рис. 3.2). Создание изображения с нуля Принцип работы прост: вводите с клавиатуры произвольное описание в текстовое поле — и нейросеть сгенерирует по нему изображение. Чем подробнее будет расписана задача, тем точнее получится результат. Важно учитывать любые детали. Например, если вы хотите получить реалистичный рисунок человека рядом с автомобилем, то при постановке задачи лучше написать не просто «нарисуй человека возле машины», а «сгенерируй фото мужчины возле легкового автомобиля Мерседес на фоне большого здания». Нейросеть Artguru намного реалистичнее ге- нерирует изображения, если в задании указать «фото нарисуй фото мужчины/женщины/ре- бенка/собаки и т. д.». Если же этого не сделать, а написать что-то вроде «нарисуй мужчину», то картинка будет напоминать не живого чело- века, а кадр из анимационного мультфильма. Заранее продумайте такие нюансы, как цветовая гамма буду- щего изображения, его фон, индивидуальные особенности людей (цвет волос, одежда, аксессуары) и животных (порода, окрас, поза), время года (если картинка показывает открытое пространство) БЗ
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ и другие важные мелочи. Если вы хотите нарисовать фирменный логотип, точно опишите корпоративные цвета; для аватарки по- лезно указать ракурс и т. д. После того как описание будет составлено, щелчком мыши выберите соотношение сторон будущего изображения. Возможные варианты — 1:1 (картинка будет квадратной, этот вариант пред- лагается по умолчанию), 2:3 или 3:2. Также выберите количество изображений — одно, два или четыре. Чтобы запустить процесс генерации, нажмите кнопку «Создать» (см. рис. 3.2). Пример подробного текстового описания представлен на рис. 3.3. Изображение Видео нарисуй фото мужчтины брюнета в джинсах и худи, с мобильным телефоном в руке на фоне небоскреба 0 Загрузить изображение (необязательно) I Соотношение сторон Рис 3 3. Ппстанпвка задачи длп генерации изображения Примерно через полминуты нейросеть Artguru сгенерировала изображение (рис. 3.4). Получилось достаточно реалистичное изображение. Картинка похожа на фотографию, небоскребы на заднем плане выглядят вполне правдоподобно. Подобные изображения можно исполь- зовать для публикации на обложках журналов. В описании ничего не говорилось о времени года, и оно по- казано нейтрально: не видно ни снега, ни дождя, ни деревьев с зеленой или желтой листвой. Единственный домысел со стороны нейросети, который бро- сается в глаза, — это то, мужчина держит мобильные телефоны в обеих руках: вероятно, это произошло потому, что при поста- новке задачи не было указано, в какой именно руке он должен держать мобильник. Также ИИ самопроизвольно изобразил мо- лодого мужчину, хотя о возрасте в задании ничего не говорилось. Еще один нюанс — человек изображен не в полный рост, об этом БЧ
Нейросеть Artguru — просто и со вкусом тоже при постановке задачи не упоминалось. Но в целом качество и реалистичность картинки на вполне достойном уровне, особенно с учетом того, что она сгенерирована бесплатно. Рис. 3 Ч. Изображение челсвека, сгенериргваннае нейрогетьл Artguru Количество бесплатных генерируемых изо- бражений ограничено Каждому пользователю предоставляется небольшой «кредит», который дает получить несколько картинок в сутки. Это касается всех режимов работы нейросети Artguru, включая редактирование фотографий с помощью ИИ и создание графических объектов в режиме чата (об этом пойдет речь ниже). Б5
ГЛАВА 3 Как стать художникам, или Учимся рисовать с помощью ИИ Иногда это ограничение удастся обойти, воспользовавшись другим браузером. Например, если вы выбрали лимит бесплатных картинок, работая в Opera, попробуйте открыть Artguru в Mozilla Firefox или Google Chrome. А вот обойти ограничение с помощью VPN или регистрации на сайте не удастся. Также лимит снимается для тех, кто пользуется нейросетью на платной основе (предлага- ются разные тарифные планы под нужный бюджет и потребности). Создание и редактирование графики в режиме чата У нейросети Artguru есть и другой режим рабозы создания изо- бражений — в виде чата. Здесь процесс протекает в классическом формате взаимодействия с чат-ботами: пользователь вводит опи- сание и получает результат, при необходимости дает уточняющее задание и г. д. Для перехода к генерации изображений в режиме чата выпол- ните команду «Инструменты искусственного интеллекта» — «Чат в изображение» (рис. 3.5) или щелкните по соответствующей ссылке в главном интерфейсе нейросети (см. рис. 3.2). Фото в AI-искусство сделать фото четким ИИ-генераторов зидео [ Наг в изображение ивам или фото Познайте волшебство генерации искусе* интеллекта - со здавайте шедевры за секунды1 скение А1 Аватар того, что вы хотите чтобы искусственный интеллект создал Удаленке фона Замена лиц (вссОкятвзыю) Соопяжмнае старое В 11 Рис. 3 5 Переход в режим райзты чатв После этого на экране отобразится интерфейс чат-бота Artguru (рис. 3.6). Он универсальный и может использоваться для гене- рации и картинок, и текста.
Нейросеть Artguru — прости и сп вкусом Artguru Al Чат Нужны изображения или текст? Чат-бот Artguru Al, работающий на технологии GPT. с легкостью справляется и с тем, и с другим, •> • AHguru Чат-бот 11ри*-ь. rro 'tar-vor Artguru Al. IOTOBV ,ш «ы создать ТПАГО логрясоихСс, м.дь то гширажеппя пли тост? Написать сообщение Artguru... Й Очистить Рис. 3 Б. Интерфейс чат-бота Artguru В нижней части окна находится текстовое поле для ввода задания. Правила работы стандартны: чем точнее и детальнее поставлена задача, тем лучше будет результат. Попросим ИИ нарисовать девушку блондинку в платье с ко- ротким рукавом, с мороженым в правой руке на фоне автомобиля «Мерседес» (рис. 3.7). Рис. 3.7. Рисунок, сгенерированный нейросетыа Artguru в режиме чата Б7
ГЛАВА 3 Как стать художникам, или Учимся рисовать с помощью ИИ Если не вдаваться в детали, то рисунок выглядит довольно реалистично и отличается хорошим качеством. Но сразу бросается в глаза, что девушка держит мороженое почему-то в двух руках, хотя в задании было четко сказано — «в правой руке». Автомобиль визуально действительно напоминает старую модель «Мерседес», но явно на это ничто не указывает (по крайней мерс, знаменитого логотипа нигде не видно). Кстати, в задании не было сказано, что < Мерседес» должен быть ретро: это нейросеть додумала са- мостоятельно. В задаче не упоминалось о времени года, но ИИ логично рассудил: поскольку девушка стоит на улице в легком платье с коротким рукавом, значит, на дворе лето. И поместил дерево с густой листвой на заднем плане. Теперь уточним задание и попросим нейросеть устранить недочет с мороженым в обеих руках (рис. 3.8). оставь мороженое тольки в одной руке, вторая рука пусть бутст свободной Рис. Зп Уточнение задачи Несмотря на то что мы сделали лишь одно уточнение, нейро- сеть предложила картинку с другим ракурсом (рис. 3.9). В целом второй вариант получился как минимум не хуже первого. Во первых, теперь девушка держит мороженое только в правой руке, как изначально и требовалось. Во-вторых, явно видно, что она стоит именно на фоне автомобиля «Мерседес», на что указывает фирменный логотип. При этом нейросеть удачно Бч
Генерируем изображения г помощью GigaEhat обыграла номерной знак автомобиля: вроде бы он и есть, но про- читать его невозможно. Это очень грамотный ход, поскольку публикация автомобильных номеров с реальными данными без разрешения их обладателя недопустима. Риг 3 9, Измененная картинка после уточнения задачи Пользователи платной версии нейросети Artguru могут переве- сти сгенерированное изображение в формат высокой четкости HD. Для этого нужно щелкнуть мышью на соответствующей иконке на изображении (см. рис. 3.8). А кнопка Download позволяет сохранить картинку на компьютере или в другом месте, данная опция доступна всем пользователям даже без регистрации. Генерируем изображения с помощью CigaChat Теперь познакомимся с популярной нейросетью DigaChat, раз- работанной IT-подразделением Сбера. Это мощный многофунк- циональный продукт, который, помимо генерации изображений, Б9
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ может вести диалоги, писать тексты и программные коды, отвечать на вопросы, создавать сценарии и решать иные задачи в зависи- мости от потребностей пользователя. Особенности и общие правила работы Нейросеть ElgaEhat находится по адресу: https://giga.chat/, который свободно открывается без VPN и прочих анонимайзеров: продукт создан отечественными разработчиками, поэтому неуязвим для санкций и прочих ограничений. Другие преимущества: ► полная русификация интерфейсов, инструментов, диалоговых окон и других элементов; ► простота и удобство в применении (работать с нейросетью EigaEhat могут даже пользователи, далекие от сферы высо- ких технологий); ► бесплатный доступ ко всему функционалу (требуется лишь идентификация через Сбер 1D, авторизоваться можно с по- мощью мобильного телефона); ► возможность работы в удобном формате — на сайте или с помощью бота в Telegram. Последний вариант может больше понравиться новичкам: не понадобится вникать в малоизвестные интерфейсы. Нейросеть сохраняет истории чатов, к каждому из них можно вернуться в любое удобное время. Есть удобные дополнительные инструменты, предназначенные для решения узкоспециальных задач, — например, для быстрого создания поздравительной, романтической или иной открытки. Стартовый интерфейс нейросети ElgaEhat показан на рис. 3.10. В левой части окна можно перейти в режим просмотра исто- рии чатов, создания нового диалога, а также к некоторым другим возможностям ИИ. В нижней части находится пункт «Профиль», предназначенный для просмотра и редактирования параметров пользовательского профиля. 7D
Генерируем изображения с помощью GigaEhat Т) 8йй? f Новый чат • История <£ Полезное О ' ДОИТ < 1 КРЫТКУ •, ПрОфИЛо -g> сообщение Чем вам помочь? —g матеижеиюд HTML дпя страницы В Определи целевую аудиторию текста _ Из-за чего ™ поваляются фобии? Нарисуй ежика-балерину Риг. 3.1G Стартовый интерфейс GigaEhat Чтобы просмотреть историю чатов, выберите пункт «Исто- рия». Справа отобразится перечень сохраненных диалогов, а еще правее — содержимое выбранного чата. Если выделить название какого-либо чата мышью, появится иконка с гремя вертикальными кнопками. При нажатии на нее отобразится меню с командами для работы с выбранным чатом (рис. 3.11). Ш ййй? Z Новый чет К история <& полезно? О СЛ**1Т. Ьн-ры"у Логотип для компании по продаже изображение Merceries 14П чуЗОЕ а Изображение футбольного мяча Поделиться в Telegram Копировать ссылку Переименовать чат Ej Добавить о избранное HJ Удалить для компании по продаже аю Какие цвета лучше использовать для логотипа? как сделать погожи запоминающимся? Нужно ли добавлять слоган к лого, ипу? Риг. 3 11. Режим работы с историей чатов Команда «Поделиться в Telegram» позволяет отправить ссылку на данный диалог одному или нескольким пользователям мес- сенджера. Функция «Переименовать чат» меняет имя чата (оно присваивается каждому диалогу автоматически, во многих случаях его стоит изменить). С помощью функции «Копировать ссылку» 71
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощья ИИ можно скопировать ссылку на диалог в буфер обмена для отправки по электронной почте, в мессенджерах и пр. Для удаления чата без возможности восстановления предназначена команда «удалить»; при этом нейросеть попросит подтвердить операцию. При большом количестве сохраненных в истории диалогов часть из них можно перенести в «Избранное». Это удобно в отно- шении наиболее актуальных для пользователя чатов, с которыми он работает чаще остальных. Выполните команду «Добавить в избранное», и текущий чат будет автоматически перенесен в соответствующий раздел. Чтобы его открыть, щелкните пункт «Избранное» справа от пункта «Все» (см. рис. 3.11). Как получить качественную картинку a CigaLhat Главное условие для генерации качественного изображения стан- дартное — точность, детализация и однозначность поставленной задачи. Искусственному интеллекту нужно популярно, по полоч- кам объяснить, что вы хотите от него получить. Тогда результат приятно удивит даже опытных пользователей. Также соблюдайте следующие рекомендации: ► Начинайте постановку задачи с глагола — «нарисуй», «при- думай», «изобрази», «сгенерируй» и т. п. Так И 1/1 поймет, что вы хотите получить от него уникальное изображение, а не перерисованное из Интернета. ► Описывайте задание предельно простым языком, без ис- пользования сложных речевых конструкций, специфических терминов, жаргонизмов и т. п. Самый эффективный стиль постановки задачи — с подробным «разжевыванием» и объ- яснением на пальцах, фактически как для ребенка. ► Вначале описывайте главный объект изображения. Напри- мер, «нарисуй мужчину/женщину/кавказскую овчарку/авто- мобиль». И И должен понять, что будет главным элементом картинки и вокруг чего выстроен ее основной сюжет. 75
Генерируем изображения с пзмищью CigaEhat ► После этого добавьте детали, дополняющие и характеризую- щие главный объект. Например, «нарисуй мужчину в возрасте 30 лет, брюнета с серыми глазами и небольшой бородкой, в бежевом костюме и белой рубашке со светло-коричневым галстуком, со смартфоном в руках». Применительно к кошке можно написать «нарисуй кавказскую овчарку в возрасте 1 года с серой шерстью в сидячей позе с высунутым языком». ► Далее перечислите детали, касающиеся фона, освещения, времени года, цветовой гаммы, стиля и т. д. — в зависимости от требований к изображению. Например, «нарисуй мужчину в возрасте 30 лет, брюнета с серыми глазами и небольшой бородкой, в бежевом костюме и белой рубашке со светло-ко- ричневым галстуком, со смартфоном в руках, в полный рост, на фоне небоскреба, рядом с автомобилем "Мерседес" си- него цвета, в вечерних сумерках». Применительно к собаке можно написать «нарисуй кавказскую овчарку в возрасте 1 года с серой шерстью в сидячей позе с высунутым языком, на зеленой траве, на фоне заката солнца, с небольшим де- ревом на заднем плане». Помните, что ИИ может своеобразно толковать те или иные моменты, и даже при подробном и грамотном описании задачи результат иногда не оправдывает ожиданий. Но почти всегда проблема решается уточнениями к исходной задаче. Важное преимущество CigaLhat — он поддер- живает не только текстовую, но и голосовую по- становку задачи. В последнем случае требуется микрофон: он есть на смартфонах, планшетах и многих ноутбуках, а при работе со стационар- ного компьютера можно подключить внешнее устройство. DigaChat поддерживает работу с загруженными файлами. Это удобно, когда надо не сгенерировать новое изображение, а отре- 73
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ дактировать имеющееся (например, удалить лишние элементы с фотографии или, наоборот, дополнить ее деталями). Чтобы загрузить файл для дальнейшей обработки ИИ, щел- кните мышью на иконке с изображением канцелярской скрепки (рис. 3.12), после чего переместите его в открывшееся поле ме- тодом Drag & Drop или выберите для загрузки щелчком мыши, как это обычно делается в Windows. Перетащите сюда или е □.берите файл Рис 3.15. Режим загрузки файла После этого введите в текстовое поле (или речевым сообще- нием) задачу по обработке изображения — например, «дорисуй дерево», «измени цвет фона на голубой» или «добавь к этой фотографии усы и очки». После выполнения всех необходимых доработок измененную картинку можно скачать и сохранить на компьютере. Работа с изображениями на сайте CigaEhat Выше мы отмечали, что пользоваться ИИ GigaChat можно на сай- те или через Telegram бота. Здесь рассмотрим, как генерировать изображения на сайте нейросети, а в следующем разделе позна- комимся с Telegram-ботом. Главный интерфейс изображен на рис. 3.10. Это окно появ- ляется при входе в нейросеть, а также при открытии каждого нового чата (с помощью команды «Новый чат», см. рис. 3.10). Теперь попробуем сгенерировать изображение согласно заданию: «нарисуй мужчину в возрасте 30 лет, брюнета с серыми глаза- 74
Генерируем изображения с помощью Gigarhat ми и небольшой бородкой, в бежевом костюме и белой рубашке со светло-коричневым галстуком, со смартфоном в руках, в пол- ный рост, на фоне небоскреба, рядом с автомобилем '‘Мерседес" синего цвета, в вечерних сумерках». Результат показан на рис. 3.13. нарисуй мужчину з возрасле 30 лет, брюнета с серыми глазами и небольшой бородкой, в бе- жевом костюме и белой рубашке со светло-коричневым галстуком, со смартфоном в руках, в полный рост, на фоне небоскреба, рядом с автомобилем «Мерседес» синего цвега, е ве- черних сумерках Ответ 4 Рис. 3.13 Рисунок сгенерированный нейросетью Gigarhat согласно заданию В целом нейросеть неплохо справилась с заданием. Обращает на себя внимание удачный ракурс: и небоскребы за спиной муж- чины, и автомобиль смотрятся достаточно ортанично. Нс вызы- вает сомнений и время суток — хорошо видно, что на картинке показаны сумерки. Возраст мужчины, его внешность и одежда в целом соответствуют описанию. Однако многие нюансы ИИ проигнорировал. Так, нигде не вид- но, что автомобиль за спиной мужчины — именно «Мерседес», как требовалось в задании: идентифицировать марку машины по экстерьеру невозможно, а фирменной эмблемы нигде нет. 75
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ Сразу бросается в глаза то, что в руках у мужчины нет смарт- фона, хотя он предусматривался заданием. Цвет автомобиля не синий, а светлый, а на заднем плане несколько небоскребов, хотя в задаче говорилось только про один. И еще один нюанс — мужчина показан не в полный рост. Но подобные недочеты непринципиальны и в большинстве случаев легко устранимы. В нашем примере мы даже не будем уточнять задание, а просто попросим переделать его с помощью кнопки с круговыми стрелками (на рис. 3.1 3 она находится слева внизу окна). Результат показан на рис. 3.14. нарисуй мужчину в возрасте 30 лет, боюнета с серыми глазами и небольшой бородкой, в бе- жевом костюме и белой рубашке со светло-коричневым галстуком, со смартфоном в руках, в полный рост, на фоне небоскреба, рядом с автомобилем «Мерседес» синего цвета, в ве- черних сумерках Ответ 4 Рис 3 14. ПерераБатанный рисунок с прежним заданием Обратите внимание: текст задачи остался неизменным, мы только попросили нейросеть переделать рисунок, то есть пред- ложить другой вариант с прежними условиями. Этот результат больше соответствует заданию. В руках у мужчины появился 7Б
Генерируем изображения с помощью GigaEhat смартфон, а автомобиль за его спиной обрел синий цвет и обза- велся фирменным логотипом «Мерседес». Из недостатков — нейросеть так и не изобразила мужчину в полный рост, а за его спиной по-прежнему несколько не- боскребов (возможно, ИИ сделал так потому, что в задании не было прямо сказано «один небоскреб», хотя из контекста это очевидно). Прямые указания о том, что мужчину необходимо изобразить в полный рост, ИИ опять игнорировал. Проблему удалось решить нестандартно — когда уточнение задачи было сформулировано следующим образом: «сделай так, чтобы у мужчины на этом рисунке была видна обувь». После этого нейросеть все поняла правильно (рис. 3.15). сделай так, чтобы у мужчины на этом рисунке была видна обувь Ответ 4 изображение обновлено, теперь у мужчины видна обувь. Рис 3.15. Доработанный рисунок прслр нестандартной формулировки заданий Как и требовалось изначально, мужчина показан в полный рост. На месте и все остальные атрибуты: мобильный телефон в руках, 77
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ автомобиль «Мерседес» за спиной. Могут возникнуть вопросы относительно небоскреба, поскольку высота здания на картинке видна нс полностью, но этот нюанс непринципиален. Пример показал, что нейросеть GigaEhat хорошо справляется с генерированием изображений. Она достаточно адекватно вос- принимает задания — при условии, что они сформулированы четко, понятно, подробно и простым языком. Если полученный с первого раза результат вас не устраивает, одной или несколькими доработками его можно довести практически до идеала. Чтобы сохранить сгенерированное изображение, щелкните на нем правой кнопкой мыши и в появившемся меню выберите команду «Сохранить изображение как», после чего в открывшемся окне укажите путь для сохранения и имя файла. Под сгенерированной картинкой находится несколько кнопок для выполнения тех или иных действий (см. рис. 3.15). Первые две из них (с изображением сердечка и зачеркнутого сердечка) предназначены соответственно для одобрения результата и уведом- ления нейросети о том, что изображение получилось неудачным. Эти сведения ИИ использует для самообучения и впоследствии будет точнее выполнять задания. Кнопка с круговыми стрелками, как отмечалось выше, пред- назначена для переделывания изображения без внесения измене- ний в изначальную задачу (иначе говоря, нейросеть предложит другую версию созданного рисунка). Справа внизу интерфейса (см. рис. 3.15) находятся еще две кнопки: одна для копирова- ния сгенерированной картинки в буфер обмена, другая — для ее отправки в Telegram или копирования ссылки на рисунок для последующей отправки по e-mail или через мессенджеры (при нажатии открывается меню с соответствующими командами). Рисование с помощью чат-бота в Telegram Чат-бот нейросети EigaEhat в Telegram доступен по ссылке https:// t.me/gigachat_bot, также его легко найти через поиск в мессен- джере. Стартовый интерфейс показан на рис. 3.16. 73
Генерируем изображения г пзмищью GigaEhat Меню Рис 3 1Б. Начали работы с чат-битпм GigaEhat Написать сообщение— Здесь кратко описаны возможности чат-бота и есть ссылка на текст пользовательского соглашения, с которым нужно озна- комиться до начала работы. Кнопкой «Меню» можно перейти к основным функциям и режимам работы. Кнопка с изображением канцелярской скрепки предназначена для загрузки файлов — это удобно для редактирования изображений. В текстовом поле с клавиатуры вводится описание задания, также можно ввести его с помощью голосового сообщения. Одно из основных правил при составлении заданий — на- чинать их с глагола, об этом чат-бот напоминает перед началом работы. Поскольку мы рассматриваем его с точки зрения создания рисунков, постановку каждой задачи нужно начинать со слова «Нарисуй» или «Сгенерируй». Остальные требования стандартны: максимально подробное составление задания простым и понятным языком. Если какие- то подробности упущены, ИИ додумает их самостоятельно. Например, если поставлена задача «нарисуй ребенка возле реки», то нейросеть может изобразить как мальчика, так и девочку, при этом самостоятельно решит вопрос с сезоном (зима/лето/осень/ 79
ГЛАВА 3 Как стать художникам, или Учимся рисовать с помощью ИИ весна), временем суток (обычно день, но не обязательно), фоном и окружающей обстановкой (трава, берег, дорога, деревья и т. д.). На рис. 3.17 показан результат задания «нарисуй немецкую овчарку на траве». нарисуй немецкую овчарку на траве - уу нарисуй немецкую овчарку на траве вот такая картинка с немецкой овчаркой на траве у меня получилэсо. Рис 3.17. Рисунок, сгенерированный чат-Вотом CigaCnat в Telegram Эту карч инку чат бот нарисовал примерно за полминуты. С учетом короткого и слабо детализированного описания зада- чи результат вполне приемлемый. На картинке действительно изображена немецкая овчарка на траве, изображение получилось достаточно реалистичным. Все остальные нюансы, о которых ни- чего не говорилось в задаче, нейросеть додумала самостоятельно: уо
Генерируем изображения с помощью GigaEhat собака лежит (хотя могла стоять, сидеть, находиться в прыжке и пр.), у нее открыта пасть с высунутым наружу языком, за спиной красивый деревенский пейзаж, на шее ошейник. При необходимости задание можно уточнять и дополнять столько угодно. С помощью стандартных команд и функций Telegram картинку можно скопировать в буфер обмена, сохранить в отдельном файле, переслать или удалить. Для рисования картинок можно воспользоваться расширенны- ми функциями чат-бота. Нажмите кнопку «Меню», затем выберите пункт «Нарисовать картинку» (рис. 3.18). GigaChat х Функции Избранные Примерить разные образы с помощью фильтров с переносом лица X® Функции £ Профиль @>gigacha-_bo- Рис 3 1В Переход в режим работы с изображениями
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ Далее на экране отобразится окно настройки параметров изображения (рис. 3.19). <- GigaChat © Нарисовать картинку Описание нарисуй ястреба в небе Размер Квадрат Альбом Пертрет Стиль Рисунок карандашом ©gigachai_oot Рис 3.19 Настройка параметров изебражения Использование этого режима упрощает и частично автома- тизирует процесс составления задания. Можно не прописывать в задаче некоторые нюансы (или проговаривать их при вводе голосовой команды). В поле «Описание» с клавиатуры вводится текстовое описание задачи. Его объем не должен превышать 500 символов с пробела ми. Оставшееся количество знаков рассчитывается автоматически по мере ввода текста и отображается в правом нижнем углу поля (на рис. 3.19 можно ввести еще 478 символов).
Генерируем изображения г помощью GigaEhat Параметр «Размер» определяет соотношение сторон и ориен- тацию картинки. Возможны три варианта — «Квадрат*? (стороны будут одинакового размера), «Альбом» (изображение будет гори- зонтальным) и «Портрет» (вертикальная картинка). В поле «Стиль» можно выбрать стиль, которого должен при- держиваться чат-бот при создании картинки. При щелчке мышью в данном поле открывается окно, изображенное на рис 3.20. <- GigaChat О Стили Рождество Мультфильм Классицизм Портрет Хохлома Рисунок карандашом Айвазовский @gigachat_bot Рис. 3.20. Выбор стили для создания картинки Для выбора доступны стили «Аниме», «Картина маслом», «Рисунок карандашом», «Классицизм», «ЗП-рендер» и др. При вз
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ этом выбирать стиль необязательно: опция просто может придать рисунку характерные особенности. После настройки параметров нажмите кнопку «Нарисовать». На рис. 3.21 показан рисунок, сгенерированный в соответствии с заданием на рис. 3.19. <г GigaChat О Сохранить @gigachat_bot Рис З.В1 Изображение, сгенерированное чат-Вотом пс заданным параметрам ИИ предлагает четыре варианта рисунка; просмотреть их можно щелчком мыши на соответствующих иконках (см. рис. 3.21). Чтобы вернуться в режим настройки параметров и изменить задание, щелкните на иконке с изображением карандаша слева внизу окна (см. рис. 3.21). Откроется окно, как на рис. 3.19, в ко- тором выполнятся необходимые действия. УЧ
ГвнерируЕм изображения с помощью GigaLhat Если сгенерированный рисунок не соответствует ожидани- ям, а вносить изменения в изначальную задачу не хочется или не нужно, можно попросить нейросеть перерисовать его заново с прежними параметрами настройки. Для этого нажмите кнопку с круговыми стрелками. На рис. 3.22 показано перерисованное изображение. <- GigaChat О : х Сохранить @gigachar_bot Рис 3 S5 ПЕреригованное изображение с прежними параметрами настройки В числе предложенных вариантов есть такой, в котором ястреб не парит в небе, а спокойно сидит. После нажатия кнопки «Сохранить» созданное изображение будет перенесено в основной чат (рис. 3.23). В5
ГЛАВА 3 Как стать художникам, или Учимся рисовать с помощью ИИ Рис. 3 ВЗ ИзпБражвнив пвррнвсвно в основной чат Написать сообщение... Отсюда картинку можно скопировать в буфер или сохранить в отдельном файле с помощью стандартных команд Telegram, вызываемых нажатием правой кнопки мыши. Распознавание фотографий и других изображений Одна из интересных и полезных функций Telegram-бота CigaLhat — распознавание фотографий. Принцип такой: пользователь загружа- ет файл с фото, а нейросеть текстом описывает его содержимое. Это может пригодиться для распознавания неизвестных изображений, УБ
Генерируем изображения г помощью GigaEhat выявления малозаметных деталей на фотографиях и т. д. Процесс занимает от нескольких секунд до нескольких минут с момента загрузки; иногда (например, если фотография изобилует разными объектами и деталями) он может затянуться. Для перехода в режим распознавания фотографий нужно в окне, изображенном на рис. 3.18, выбрать функцию «Распознать фото» (рис. 3.24). GigaChat © х Избранные Функции Распознать фото опишу объект, который вижу Функции О Профиль (S,gigachat_bot Риг. 3 54. Выбор режима распознавания ф..тп После этого на экране отобразится окно (рис. 3.25), из которого можно перейти в чат для распознавания изображений. S7
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ <- GigaChat © : х '*у> Анна J Определи, что на фото На фото лори — ночкой примат, использующий ДЛИННЫЙ хвост для балансировки на деревьях. 11:53 Распознать фото Загрузите изображение, и я помогу вам: Определить, что там находится ft Переьести текст на русский язык Добавить забавную подпись Подобрать аксессуар к образу ® Придумать ответ на сообщение Перейти в чат ©gigachai_bot Рис. 3 Е5 Окна перехода ь чат для распознавания изображений После нажатия кнопки «Перейти в чат» на экране отобразится интерфейс Telegram-бота Cigarhat в режиме работы с распознава- нием изображений (рис. 3.26). Меню Написать сообщение... Рис ЗЕБ Чат-Еот е режиме распознавания изображений
Генерируем изображения с помощью GigaChat Telegram-бот GigaEhat умеет распознавать содержимое не только фотографий, но и других изображений (например, скриншотов, эмблем и т. д.). Основные возможности: ► Определение объектов. Например, если вы загрузили фо- тографию льва, то нейросеть выдаст примерно следующее описание: «на фото лев, самый крупный хищник семейства кошачьих, считается царем зверей, проживав! в Африке». ► Перевод текста на русский язык. Вы можете загрузить картинку с надписью на иностранном языке: И И распознает ее и переве- дет на русский. Но результат перевода лучше проверить в на- дежных источниках: нейросеть может по-своему распознавать и идентифицировать текст, не учитывать некоторые жаргонизмы, фольклоризмы, лексические, морфологические и иные особен- ности разных языков. Нос переводом простых, однозначно трактуемых и коротких текстов она справляется неплохо. ► Подбор подходящих аксессуаров к образу. Например, можно загрузить свою фотографию в определенном наряде и спро- сить у 1/1 И, чем можно дополнить этот образ. В качестве ответа возможны такие рекомендации: «удачным дополнением образа станет золотистый браслет/розовая помада/бежевый клатч/серебряные часы/черная бейсболка» и т. д. ► Придумывание комментариев или ответов на текстовые сообщения. Например, можно загрузить скриншот поста или электронного письма, в котором кто-то из знакомых про- сит посоветовать хороший семейный фильм для просмотра с детьми, и попросить И И ответить на заданный вопрос. ► Добавление подписей к фотографиям и изображениям. Например, можно загрузить собственное смешное фото и попросить нейросеть придумать к нему шуточную подпись, чтобы потом разослать друзьям. Помимо перечисленных, ИИ может выполнять и другие задачи, связанные с распознаванием фотографий и изображений.
ГЛАВА 3. Как стать художникам, или Учимся рисовать с помощью ИИ Для примера попросим нейросеть распознать и описать фо- тографию, которую мы ранее сгенерировали на сайте GigaEhat (см. рис. 3.15). Результат представлен на рис. 3.27'. Определи что на этом фото /аггдрззе | ИМ Определи, что на этом фото На фотографии изображен мужчина в деловом кос поме стоящий рядом с автомобилем Mercedes-Benz. Он держит в руках мобильный телефон. Номерной знак автомобиля ВТА 9538. Фон изображения состоит из городских зданий и дороги. 22:29 22.29 V/ Меню Рис. 3.57. Пример распознавания фотографии Написать сообщение... ИИ описал содержимое фото довольно неплохо. Все достаточ- но четко и подробно, включая марку автомобиля. Единственное, что нейросеть не распознала, — это сумерки, но данный фактор можно считать малозначительным (тем более что мужчина и объ- ект хорошо освещены, это могло ввесги ИИ в заблуждение). Также некорректно расшифрован номер автомобиля: на изображении он недостаточно хорошо читается, и некоторые фрагменты (в част- ности, левую часть номерного знака) нейросеть додумала сама. В целом Telegram-бот GigaEhat — это мощный, многофунк- циональный и простой в пользовании инструмент. С ним 90
Генеративная модель Kandinsky — цдиБный инструмент для рисования можно легко и быстро генерировать изображения, распознавать фотографии и решать иные задачи по работе с графическими объектами. Генеративная модель Kandinsky - удобный инструмент для рисования В этом разделе мы рассмотрим еще один продукт, работающий на базе ИИ, — генеративную модель Kandinsky. Он создан отече- ственным разработчиком — некоммерческим институтом искус- ственного интеллекта AIRI, и умеет генерировать изображения на основании заданий на разных языках. Поскольку нейросеть Kandinsky создана в России, все ее ин- терфейсы и инструменты русифицированы, при этом поддержи- вается также английский язык (переключение осуществляется щелчком мыши). Пользоваться генеративной моделью Kandinsky можно бес- платно, но нужна регистрация. Это делается прямо на сайте всего за несколько минут, нужен лишь действующий e-mail: его необхо- димо будет подтвердить с помощью ссылки, которую Kandinsky пришлет в электронном письме. Функциональные возможности Нейросеть Kandinsky доступна в двух вариантах — на сайте https://rusionbrain.ai и в Telegram-боте по адресу: https://t.mc/ kandinsky21_bot. Далее рассмотрим порядок работы с каждым из них. В любом случае у продукта есть следующие функции: ► создание картинок с нуля на основании текстовых запросов (их можно вводить на 101 языке, что позволяет работать с нейросетью пользователям из разных уголков мира); ► генерация рисунков в разных стилях и представлениях — от максимально реалистичных фотоизображений до цифровой 91
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ живописи, аниме, хохломы и др. (пользователь может сге- нерировать одну и ту же картинку в нескольких вариантах); * редактирование созданных ранее фотографий и изображе- ний — они загружаются в рабочую область штатными сред- ствами Kandinsky, после чего можно удалять и корректировать те или иные области, менять фрагменты и т. д.; ► соединение двух картинок в одну, при необходимости — с редактированием; ► достраивание сгенерированных рисунков: к созданному изображению можно добавить элементы справа, слева, снизу и сверху. С помощью Kandinsky можно решать и другие задачи, перечень которых зависит от текущих потребностей (включая генерацию видео, создание стикеров и аватаров). Все картинки, созданные и отредактирован- ные с помощью Kandinsky на сайте https:// fusionbrain.ai. доступны только в текущем сеансе работы. Нейросеть не ведет историю диалогов и не сохраняет картинки на сервере или где- то еще, после выхода из системы все рабочие материалы утрачиваются без возможности вос- становления. Поэтому понравившиеся картинки сразу сохраняйте на компьютер или в облако. Но это не относится к Telegram-боту: здесь картинки и рабочий процесс автоматически сохраняются в чате, как при обычной переписке в мессенджере. Важное преимущество — удобство в пользовании: не нужна предварительная настройка, работать можно сразу после авто ризации, интерфейс и рабочие инструменты просты и понятны. Но по скорости генерации изображений Kandinsky несколько уступает конкурирующим нейросетям, включая те, с которыми мы 92
Генеративная модель Kandinsky — удобный инструмент для рисования познакомились выше. На подготовку изображения как на сайте, так и в Telegram-боте может уйти несколько минут, в то время как другие аналогичные ресурсы справляются с подобными задани- ями меньше чем за минуту. Во многом длительность процесса зависит от сложности поставленной задачи. Как написать хороший промпт для Kandinsky Подготовка текстовых запросов для генерации изображений с по- мощью Kandinsky ведется в целом по таким же правилам, что и для других нейросетей. Но есть особенности, характерные именно для этого продукта. Чтобы написать хороший промпт для Kandinsky, учитывайте следующие рекомендации: ► избегайте использования частиц «не» и прочих отрицаний, поскольку И И не всегда корректно трактует и интерпрети- рует их; ► начинайте постановку задачи с описания главных объектов (человек, самолет, животное, дерево, автомобиль и т. п.); ► укажите действие, которое на картинке должен совершать главный объект (например, животное можег сидеть, лежать, стоять, находиться в прыжке, плыть в воде и пр.); ► определите место, где происходят изображаемые на картинке события (офис, лес, дорога, городская или сельская улица, поле, комната и т. д.); ► укажите стилистику рисования (если в меню, предложенном Kandinsky, нет подходящих позиций, можно для аналогии привести фамилии известных фотографов, художников, других представителей сферы изобразительного искусства). Нежелательно перегружать нейросеть чрезмерным количеством подробностей. Важно найти баланс между детализацией задания и тем, как его воспринимает ИИ. Например, не стоит ставить задачи, в которых много объектов, и каждый расписан с обилием деталей: нейросеть может запутаться и выдать плохой результат. S3
ГЛАВА 3. Как стать художником, или Учимся рисовать с помощью ИИ Важная особенность Kandinsky — возможность составлять негативные промпты. Речь идет об объектах и деталях, которые нужно исключить из генерируемого изображения. Например, если вы хотите получить рисунок самолета в чи- стом голубом небе, то в негативном промпте можно написать «облака, птицы, тучи». В этом случае на картинке будет изобра- жено только воздушное судно — без объектов, которые теорети- чески тоже могут находиться в воздухе. А при генерировании городского пейзажа из него можно сразу исключить, например, рекламные щиты, коммерческие киоски и прочие атрибуты современности, наличие которых будет неуместным с учетом замысла картинки. Создание изображений на сайте Kandinsky Чтобы генерировать изображения на сайте Kandinsky, перейдите по адресу: https://fusionbrain.ai. Отобразится главная страница ресурса (рис. 3.28). Рис З ЕН Главная страница Kandinsky В правом верхнем углу находится кнопка с изображением глобуса — она предназначена для переключения языка интер- фейсов и инструментов (на рис. 3.28 выбран русский язык). Для перехода к работе с изображениями нажмите кнопку «Начать» 94
Гв н е р ат и ин d я модель Kandinsky — удобный инструмент для рисования или «Открыть редактор» (они находятся соответственно справа вверху и внизу, см. рис. 3.28). Если вы еще нс авторизованы на сайте, программа предложит ввести логин и пароль или зарегистрироваться; процесс занимает максимум ггару минут. После авторизации на экране отобразится окно редактора (рабочий интерфейс, рис. 3.29). Рис 3 59 Рабочий интерфейс нейрпсети Kandinsky Центральную часть интерфейса занимает рабочая область. Здесь отображаются сгенерированные картинки, происходит доработка и редактирование изображений. Перед началом работы задайте формат рисунка, определив соотношение сторон. По умолчанию предлагается 1:1 (см. рис. 3.29), также еегь варианты 16:9, 9:16, 2:3 и 3:2. Изменить размеры рабочей области и разрешение рисун- ка можно вручную: для этого нужно навести указатель мыши на кружок в любом углу и переместить границы в требуемое положение. При этом важно учитывать, что максимальное раз- решение, поддерживаемое нейросетью, — 1024х 1024 (оно также предлагается по умолчанию). 95
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ Сразу под рабочей областью расположены инструменты для постановки задачи на генерацию изображений. Щелчком мыши по соответствующей ссылке выбирается требуемый параметр — «Промпт» (основное описание), «Негативный промпт» (то, что необходимо исключить при создании картинки) и «Стиль». В пер- вых двух случаях задание вводится с клавиатуры в текстовом поле (справа от него находится кнопка для запуска процесса генера- ции), а при выборе пункта «Стиль» на экране отображается окно, которое показано на рис. 3.30. Риг 3 30. BbiBop стиля изображения 9Б
Генеративная модель Kandinsky — удобный инструмент для рисования Стиль выбирается в зависимости от тематики, сюжета, назначе- ния и других особенностей рисунка. Например, если вам нужно художественное изображение, можно выбрать стиль «Картина маслом», а если максимально реалистичная картинка — «Деталь- ное фото» или «Студийное фото». Вы можете сгенерировать один и тот же рисунок в нескольких разных стилях и выбрать оптимальный вариант. Слева вверху над рабочей областью (см. рис. 3.29) находится инструментальная панель с кнопками; их названия отобража- ются в виде всплывающих подсказок при наведении указателя мыши. Это: ► выбор инструмента «Ластик» (можно и стереть с изображения те или иные фрагменты/ как это делается резиновым ластиком на бумаге. При нажатии кнопки отображается ползунок для выбора размера); ► вставка изображения из сохраненного ранее файла (на- пример/ на компьютере) для его обработки средствами 1/1 И; ► отмена и восстановление последнего выполненного дей- ствия; вызов справки; ► удаление всего содержимого рабочей зоны (это действие необратимо, поэтому на экране выдается дополнительный запрос на подтверждение операции); ► скачивание созданного изображения в виде отдельного файла на компьютер или другой носитель. Можно сохранить не только конечный, но и промежуточный результат — на- пример, чтобы вернуться к работе с ним спустя некоторое время. Теперь попробуем дать нейросети Kandinsky следующее зада- ние: «нарисуй собаку хаски светлого окраса на зеленой траве». Разрешение картинки и соотношение сторон оставим по умол- чанию. Результат показан на рис. 3.31. 97
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ Рис, 3.31 Рисунок, сгенерированный нейросетью Kandinsky Хотя мы не выбирали стиль изображения, оно напоминает качественную фотографию и выглядит очень реалистичным: это касается даже мелких деталей вроде травы на переднем плане. Порода и окрас собаки полностью соответствуют заданию за тем исключением, что шерсть у нее не полностью светлая, а с темными пятнами. Но это вряд ли можно считать недостатком, посколь- ку картинка в таком варианте выглядит красивой и еще более достоверной. От себя ИИ добавил ошейник, но он органично вписывается в сюжет и не перегружает его лишними деталями. 93
Генеративная модель Kandinsky — удобный инструмент для рисования При необходимости его можно убрать, указав слово «ошейник» как негативный промпт и заново запустив процесс генерации. Теперь изменим задание и попросим И И нарисовать самолет «Боинг 747», летящий в небе. В качестве негативного промпта укажем «птицы», а соотношение сторон изменим на 3:2. Результат выполненных действий показан на рис. 3.32. Рис 3 32 Сгенраированнпе изпбражение пассажирского авиалайнера Получился летящий в небе самолет, птиц поблизости нет (как и было предусмотрено негативным Промптом). Нейросеть не указала на самолете его марку, но по очертаниям нетрудно понять, что это именно «Боинг 747», как и было указано. Един- ственная деталь, додуманная ИИ, — выпущенные шасси: по ним можно сделать вывод, что самолет взлетает или заходит на посадку. Но в задании никаких ограничений на этот счет не было. 59
ГЛАВА 3 Как стать художникам, или Учимся рисовать с помощью ИИ На сайте нейросети Kandinsky можно генерировать каче- ственные, реалистичные изображения на разные темы и в разных стилях. При этом ИИ достаточно адекватно трактует задания. Создание изображений с помощью Telegram-бота Kandinsky Telegram-бот Kandinsky находится по адресу: https ://t.me/ kandinsky21_bot и бесплатно доступен всем пользователям мессенджера. По сравнению с веб-версией он выглядит более простым в использовании, хотя это скорее дело привычки. Он может генерировать изображения по составленному текстовому описанию, дополнять и редактировать картинки, генерировать аватары, стикеры, фирменные логотипы и пр. По умолчанию интерфейсы и инструменты Telegram-бота Kandinsky русифицированы; при желании можно переключиться на английский язык. Стартовый интерфейс, отображаемый сразу после запуска бота, показан на рис. 3.33. I Привет, я Kandinsky bot! j Я умею: Генерировать изображения по описанию £ Генерировать видео по описанию „ Смешивать, делать вариации и перенос стиля с изображений V Создавать аватары в образах крутых персонажей Создавать стикеры Начиная использование телегоам-бота. вы соглашаетесь с правилами пользования, ознакомиться с которыми можно здесь: /rules | То switch the language, click /language or visit fusiontram.ai 1 Рис 3.33 Приветгтвенншй интерфейс Telegram-брта В этом окне кратко описаны возможности Telegram-бота Kandinsky, а также есть ссылки для переключения языка интер юс
Генеративная модель Kandinsky — удобный инструмент для рисования фейсов и перехода па сайт продукта, который мы рассмотрели в предыдущем разделе. Главное меню бота показано на рис. 3.34. Рис. 3 34. Главное меню Telegram-бота Kandinsky Чтобы создать изображение с нуля, необходимо выбрать пункт «Генерация изображений». Также нейросеть может работать с ранее созданными картинками (редактирование, объединение, допол- нение и пр.); для перехода в этот режим есть команда «Работа с изображениями». Кроме этого, в меню есть пункты для создания стикеров и аватаров, а также для генерации видео. После выбора команды «Генерация изображений» Telegram-бот попросит ввести текстовый запрос на создание картинки (рис. 3.35). При этом стоит соблюдать те же правила составления промптов. Введите текстовый запрос / Чтобы картинка получилась красивой и ожидаемой, постарайтесь указать побольше деталей: описание объектов настроение, цвета 1 ф Написать сообщение... Назад I* Главное меню Рис. 3 35 бнод запроса на генерацию изображения 101
ГЛАВА 3 Как стать художникам, или Учимся рисовать с помощью ИИ Попросим ИИ сгенерировать рисунок по следующему за- просу: «нарисуй серого кота на подоконнике рядом с цветком герани в горшке». После отправки запроса на экране отобразятся параметры изображения и дополнительное меню (рис. 3.36). Параметры генерации изображения Вы можете начать генерацию либо настроить дополнительные параметры: Промпт: нарисуй серого кота на подоконнике рядом с цветком герани в горшке Стиль: Без стиля Соотношение сторон. Квадрат 1:1 Модель: Kandinsky 3.1 Негативный промпт: Нет 7 Начать генерацию Соотношение сторон .. --------------.-------------------- ★ Стиль с* Промпт •* Модель “ Her. промпт -----------------1-------------------- Назад (* Главное меню Рис ЗЗБ Настройка параметрон генерируемого изображения Чтобы сгенерировать рисунок с параметрами, предложенными по умолчанию (они перечислены в верхней части окна — стиль, соотношение сторон, модель нейросети, негативные промпты), нажмите «Начать генерацию». На рис. 3.37 показана картинка, созданная в соответствии с нашим запросом. В целом бот правильно понял задание. Изображение кота больше похоже на рисунок, чем на фотографию, но, поскольку конкретный стиль не был указан, это нормально, и даже так кар тинка выглядит реалистичной. После генерации рисунка Telegram-бот предлагает пользо- вателю следующие варианты дальнейших действий (рис. 3.38). IDE
Гвнрратииная модель Kandinsky — удобный инструмент для рисования Рис 3.37 Картинка чат-Бота Kandinsky, сгенерированная по запросу ч» Новое изображение Рис 3.3В Варианты действий после генерации рисунка Если сгенерированная картинка по каким-то причинам не устраивает, но менять задание не хочется, можно перерисовать юз
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ ее с помощью кнопки «Повторить генерацию»; при этом ИИ будет работать по прежним параметрам. Чтобы изменить зада- ние (например, выбрать другой стиль или добавить негативный промпт), выберите пункт «Изменить параметры». С помощью команды «Новое изображение» осуществляется переход в режим генерации нового рисунка на основании заново сформулиро- ванного задания. Последний пункт в списке предназначен для возврата в главное меню. С помощью функции «Стиль» (см. рис. 3.36) можно выбрать стиль картинки. При нажатии кнопки бот предлагает выбрать один из следующих вариантов: «Без стиля» (применяется по умол- чанию), «Детальное фото», «Цифровая живопись» и «Аниме». На рис. 3.39 показана картинка, которая сгенерирована по тому же заданию, что и на рис. 3.37, с единственным изменением — был выбран стиль «Цифровая живопись». Рис. 3.39. Рисцнак в стилв «.Цифровая живопись». 1ПЧ
Генеративная модель Kandinsky — удобный инструмент для рисования Кнопкой «Промпт» (см. рис. 3.36) можно вернуться в режим редактирования текстовой части задания и внести дополнения или уточнения. Кнопка <<Нег. промпт» предназначена для ввода негативного Промпта (деталей и объектов, которые нужно ис- ключить из генерируемого рисунка). Функция «Соотношение сторон» (см. рис. 3.36) позволяет выбрать один из следующих форматов картинки: 16:9 (панорама), 9:16 (портрет) или 1:1 (ква- драт); последний вариант предлагается по умолчанию. Telegram-бот Kandinsky довольно неплохо умеет рисовать ава- тары на основе загруженных фотографий. Для перехода в соответ- ствующий режим необходимо в меню, изображенном на рис. 3.34, выбраз ь пункт «Аватар». Дальнейшие действия выполняются в пошаговом режиме по обычным правилам работы с Telegram-ботом. Нужно выбрать пол — мужчина или женщина (это делается щелчком мыши), а затем стиль из предложенных шести вариантов (рис. 3.40). На рисунке выбран пол «Мужчины» (он отмечен флажком). Для выбора стиля нужно щелкнуть мышью по цифре, которая соответствует понравившемуся варианту. Далее нужно выбрать фотографию, которая будет использована для создания аватара. При это учитывайте следующее: ► снимок должен быть сделан крупным планом, а взгляд на- правлен прямо в камеру; ► загружать фотографию нужно именно как фото, а не как файл. Выбирайте соответствующий пункт в меню, которое открывается при наведении указателя мыши на икон- ку с изображением скрепки слева от текстового поля, см. рис. 3.35; ► следите за тем, чтобы на снимке не было объектов, закры- вающих лицо. Также недопустим сильный поворот головы в ту или иную сторону; ► убедитесь в том, что на фотографии изображен один человек и не в полный рост. ins
ГЛАВА 3 Как стать художником, или Учимся рисовать с помощью ИИ Рис З.ЧП. Быйпр образа для ааатара Процесс генерации аватара занимает примерно от одной до нескольких минут, в зависимости от сложности картинки и объема загруженной фотографии. По похожему алгоритму можно генерировать стикеры — с той разницей, что здесь будет достаточно ввести текстовый запрос.
ГЛАВА 4 «А МУЗЫКА ЗВУЧИТ»... УЧИМСЯ СОЗДАВАТЬ МЕЛОДИИ С ПОМОЩЬЮ ИИ Нейросети можно использовать в качестве альтернативы про- граммам, предназначенным для создания музыки. Представьте, что у вас есть волшебный композитор, кото- рый умеет писать музыку. Он экономит ваше время, потому что вам не нужно учиться играть на инструментах или разбираться в сложных редакторах. Вместо этого вы просто говорите ему, какую мелодию хотите, и он сразу начинает творить. Он умеет генерировать композиции как по заданным текстовым запросам, так и по загруженным образцам аудиотреков. И И-композитор также очень ленивый, поэтому не тратит особых усилий. Вы можете выбрать один из готовых шаблонов, а потом — лучшую мелодию из нескольких вариантов. Такие по- мощники делают музыку доступной даже для тех, кто не умеет играть на инструментах. Конечно, написать шедевры мировой музыкальной культуры с помощью нейросетей не получится, но создать добротный про- дукт, подходящий для коммерческого применения или в качестве хобби, — вполне. 107
ГЛАВАМ «а музыка звучит» Учимся создавать мелодии с помощью ИИ Особенности создания музыки с помощью l/11/l Принцип работы нейросетей по написанию музыки базируется на распознавании и генерации аудиосигналов. ИИ анализирует наборы данных, на основании полученной информации выявляет закономерности, а затем создает собственные треки. ИНТЕРЕСНЫЙ ФАКТ Специально настроенные сетевые алгоритмы постоянно мониторят музыкальный контент в Интернете и других источниках. Они улав- ливают типичные шаблоны, модели, образцы, фрагменты, на основании которых предлагают разнообразные мелодии. Нейросети умеют писать музыку с вокальными партиями. Учитываются такие важные факторы, как ритмика, структура сти- хотворного текста, интонация. Можно создавать синтезированный звук, а также использовать другие музыкальные треки в качестве композиционной основы. Преимущества генерирования музыки с помощью нейросетей Этот принципиально новый подход ранее никогда не использо- вался, потому что ИИ попросту не было. Сегодня привлечение нейросетей для написания музыкальных произведений дает следующие преимущества: ► Экономий арвмЕНИ. Пользователю не нужно составлять пар- титуры, отвлекаться на работу с инструментами, заниматься аранжировкой и другими творческими вопросами, что прихо- дится делать при работе с классическими аудиоредакторами и нотными приложениями. ► Доступность. Чтобы генерировать музыку с помощью И И, необязательно знать нотную грамоту и иметь музыкальное 10S
□ сибеннисти создания музыки с помощью ИИ образование. Есть нейросети, где для получения трека до- статочно задать его текстовое описание, выбрать стиль, ритм, инструменты и прочие параметры будущей композиции. Все делается в пошаговом режиме по стандартному алгоритму. Иногда И И предлагает сразу несколько вариантов в рамках одного и того же задания. ► Финансовая выгода Не нужно платить за написание му- зыки профессиональным композиторам или покупать ее на специализированных ресурсах. Некоторые нейросети бесплатные и позволяют пользоваться своим функциона- лом без ограничений. Другие если и берут плату, то в ряде случаев она символическая. Это позволяет за короткий срок при минимуме или полном отсутствии расходов получить большое количество разнообразных треков. ► Возможность выбора. При работе со многими нейросетями можно использовать один и тот же шаблон для получения разных композиций: быстрых, медленных, в нескольких стилях и пр. Это позволяет выбрать оптимальный вариант или сделать сразу несколько треков для разных целей. ► Отсутствие ограничений. Количество создаваемых музыкаль- ных произведении не лимитировано. У платных нейросетей нужно лишь своевременно пополнять баланс. Бесплатные продукты могут несколько уступать по функционалу, но в обо- их случаях можно писать столько музыки, сколько нужно. Пользовательские интерфейсы и инструменты нейросетей по генерированию музыки просты и интуитивно понятны. Это позволяет успешно работать с ними даже пользователям, далеким от сферы высоких технологий. Сферы применения музыки3 сгенерированной искусственным интеллектом Бывают ситуации, когда нужно сделать музыкальное сопровожде- ние к видеоролику или другому контенту, но ничего подходящего 109
ГЛАВАМ «А музыка звучит» Учимся создавать мелодии г помощью ИИ под рукой нет. Одни треки не подходят по стилю и мелодии, дру- гие просто приелись аудитории. Есть ограничения и со стороны авторских прав, законно обойти которые можно только одним способом — купить произведение на специализированном стоке или напрямую заказать у композитора. Намного проще и выгоднее решить проблему с помощью ИИ. Это универсальный инструмент, позволяющий создавать музыку на все случаи жизни. Сгенерированные треки можно использовать: ► для музыкального сопровождения видеоконтента — напри- мер, размещаемого в социальных сетях, на видеохостингах и других площадках; ► для звукового оформления рекламных роликов (это быстро, удобно и практично — можно за короткое время подготовить музыкальный контент для разной рекламы); ► при подготовке презентаций, лекций, прочих публичных выступлений; ► для фонового сопровождения интернет-стримов, подкастов, онлайн-игр; ► для музыкального оформления аудиоблогов; ► при создании любительских видеороликов в развлекатель- ных целях. Генерировать музыку с помощью ИИ можно и для решения других задач, учитывая предпочтения целевой аудитории, спе- цифику контента, его направленность и пр. Способы написания музыки, используемые нейросетями ИИ использует разные приемы и методы, в том числе основан- ные на технологиях машинного обучения. Вот основные из них: ► Спадание партитуры. Нейросеть пишет музыку по нотам аналогично тому, как это делают профессиональные компо- 110
□ euSehhlil'tm создания музыки с помощью ИИ зигоры. В результате создается перечень нот и аккордов, при воспроизведении которых звучит мелодия. Такая символьная запись музыки у профессиональных музыкантов называется партитурой. ► Написание музыки по шаблонам. Нейросеть генерирует ме- лодии с использованием шаблонов, по которым она училась создавать мелодии. При этом основа для написания музыки — текстовый запрос (промпт) пользователя, как при генерации текстов и изображений (см. главы 2 и 3). В описании можно ввести жанр, стиль, ритм, настроение и другие характеристики будущей мелодии. В некоторых случаях пользователи ука- зывают исполнителей или композиторов, чье творчество они хотели бы взять за основу при написании музыки. Но такую возможность поддерживают не все нейросети, поскольку возможны проблемы с соблюдением авторских прав. ► ГЕНвририванив музыки на пснпвв првдваритЕльнс загружвн- ныхтрвкпе. Нейросеть анализирует эти композиции и выдает свой вариант. Можно создавать мелодии на основе одного или нескольких источников; в последнем случае И И может предложить целый перечень вариантов. Некоторые нейросети поддерживают функционал, который позволяет извлекать из загруженных мелодий отдельные элементы — например, ритм-секцию, бэк-вокал и пр., после чего использовать их в качестве своеобразного каркаса для новых композиций. Еще одна популярная технология — генерация звуков. ИИ создает аудиосигнал, минуя стадию генерации нот. Это позволяет нейросети генерировать эффекты, имитировать вокал, создавать окружающие звуки и прочие элементы, которые делают компо- зицию реально интересным и уникальным продуктом. Есть ли у нейросети авторские права? В соответствии со ст. 1257 Гражданского кодекса Российской Феде- рации автором произведения искусства (в том числе музыкальных 111
ГЛАВА Ч «А музыка звучит» . Учимся создавать мелодии с помощью ИИ композиций) признается человек, который создал данное произ- ведение в результате своего творческого труда. Исходя из этого музыкальный контент, сгенерированный с по- мощью ИИ, не относится к категории авторского. Следовательно, нейросеть не признается автором. Если человек сгенерировал мело- дию с помощью ИИ, он также не будет являться автором, поскольку речь о творческом труде не идет. Но получить авторские права на такое произведение можно: для этого необходимо зафиксировать их с помощью соответствующего сертификата (депонировать). ИНТЕРЕСНЫЙ ФАКТ j С юридической точки зрения аудиофайлы, сге- нерированные ИИ, не защищены авторскими правами. Это позволяет свободно использовать нейромузыку в личных целях. Что касается коммерческого использования, то здесь могут возникнуть вопросы. Необходимо сразу проверить, какие мате- риалы использовались для обучения нейросети. Если это компо- зиции с истекшим сроком действия авторских прав (в России это происходит автоматически после того, как пройдет 70 лет с даты смерти автора), то никаких ограничений не накладывается. Если же ИИ обучался на материалах, у которых срок действия авторских прав не истек, то их обладатели (включая наследни- ков автора) вправе подать в суд по обвинению пользователей в плагиате. В ходе судебных заседаний будет вестись разбиратель- ство относительно того, нарушены ли авторские права, и если да, то в какой степени (полностью или нет скопировано произве- дение, какая его часть использована для создания новой мелодии и т. д.). Если иск будет удовлетворен и сгенерированный контент признают плагиатом, то онлайн-площадки, на которых он был размещен, могут заблокировать навсегдгт или на определенное время, а пользователь получит штраф. 115
Пишем музыку с помощью нейрисвти 5ипо Многие нейросети заранее предупреждают о том, что сгенери- рованные с их помощью треки могут использоваться в коммерче- ских или личных целях исключительно авторизованными лица- ми. Как правило, ИИ не предоставляет пользователям, которые работают с ним бесплатно, право размещать созданный контент на стриминговых ресурсах. Все права на музыку, сгенерированную по бесплатному доступу, остаются у нейросети. Если пользователь оформил платную подписку, то он автоматически становится правообладателем созданной музыки и может распоряжаться ей по своему усмотрению. Перед тем как приступить к генерированию музыки с помо- щью ИИ, необходимо уточнить у нейросети, как обстоят дела с авторскими правами. Тем более что с течением времени ситу- ация может меняться. Пишем музыку с помощью нейросети 5ипо Это один из самых популярных продуктов для генерирования музыкального контента. Нейросеть разработана при участии компании Microsoft. Ее преимущества — простота и удобство в работе, а также русскоязыч- ный интерфейс. Она подходит даже для пользователей, не знакомых с нотной грамотой, не имеющих музыкального образования и да- леких от мира музыки: например, блогеров, создателей рекламного контента, подкастов и т. д. Нужно лишь корректно сформулировать текстовое задание: все остальное возьмет на себя ИИ. Функциональные возможности и условия использования С помощью 5ипп можно генерировать музыкальные произведения на основе текстового запроса (промпта) или предварительно задан- ных параметров. В любом случае по каждому заданию создаются два трека, что позволяет пользователю выбрать оптимальный вариант. 113
ГЛАВА Ц «А музыка звучит» . Учимся создавать мелодии с помощью ИИ Сервис платный, однако его стоимость необре- менительна. Абонентской платы как таковой нет: пользователь просто пополняет баланс (это можно сделать через СБП, с банковской карты или через платежные сервисы), с которого авто- матически списываются суммы по мере работы с нейросетью Стоимость одного выполненного задания с двумя сгенерированными вариан- тами мелодии — от 24 рублей (цена актуальна на момент написания книги). ИИ предлагает пользователям два режима для создания му- зыки — простой и расширенный. В первом случае предусмотрено описание будущей мелодии в общих чертах. В частносги можно: ► указать стиль, жанр; ► перечислить музыкальные инструменты; ► выбрать темп, ритм и прочие характеристики произведения. Объем описания не должен превышать 200 символов. Также в данном режиме можно выбрать формат произведения — с тек- стом или только инструментальная музыка. Если вы хотите написать песню с текстом, то он будет составлен на том языке, на котором сформирован запрос. Лучше всего 5untJ понимает английский язык. При генерировании песен на дру- гих языках возможны недочеты: некорректное использование синонимов, неправильная расстановка ударений, произвольное изменение окончаний для получения рифмы и т. д. В расширенном режиме пользователю предлагается дополни- тельный функционал, с помощью которого можно конкретизиро- вать и детализировать задание. Так, появляется возможность ввести текст песни, присвоить ей название, выбрать стиль исполнения и т. д. Данный режим особенно удобен для тех пользователей, ко- торые желают получить специфический, нестандартный результат. 114
Пишем музыку с помощью нвйригрти Бипи При формировании запросов нельзя упоминать конкретных авторов и исполнителей. В про- тивном случае нейросеть выдаст сообщение об ошибке и генерация музыкального произве- дения будет невозможной. Разработчики 5ипо стремятся, чтобы с помощью ИИ создавался только оригинальный контент. К тому же упо- минание конкретных людей может привести к проблемам с авторскими правами В большинстве случаев весь процесс создания музыки в 5ипо — от постановки задачи до получения результата — занимает несколь- ко минут. Менее опытным пользователям может потребоваться больше времени, чтобы грамотно сформировать запрос. Знакомство с интерфейсом и описание режимов работы Для работы с нейросетью 5ипа удобно зайти на нее через платфор- му https://gptunnel.ru. Она обеспечивает доступ к инструментам ИИ через АР1-тоннель. Чтобы не вдаваться в технические тонкости, кратко поясним: технология обходить региональные ограничения — например, на- ложенные в связи с санкциями. Благодаря этому можно получить доступ к нейросетям, закрытым для пользователей из России, без использования VPN, анонимайзеров и прочих подобных инстру- ментов. Эта же платформа открывает доступ к нейросети ChatCPT, с которой мы познакомились в главе 2. Там мы рассмотрели, как открывать ее через VPN; теперь вы знаете альтернативный способ. Содержимое главной страницы https://gptunnel.ru показано на рис. 4.1. Вначале следует авторизоваться. Это можно сделать через аккаунт на Яндексе, а также с помощью социальных сетей, элек- тронной почты или кода, присылаемого по СМС. В центральной части интерфейса представлен перечень до- ступных инструментов. Для быстрого выбора можно воспользо- 115
ГЛАВА Ч «А музыка звучит» Учимся создавать мелодии с помощью ИИ ваться раскрывающимся списком в верхней части окна. Как видно на рис. 4.1, в списке нейросетей присутствует и уже знакомый нам EhaTOPT. ▲I Войти или зарегистрироваться используя социальную сеть Ф Войти через Яндекс G О О О -ИЛИ по СМС коду М Через эл.печту Y меня есть логин/пароль Й изображение Быстрый выбор Нагмщи код калькулятора на Python Ф ChatGPT-бесплатный Claude Sonnet-3_5 ♦ Gemini 2.5 Pro Suno Зипо - Создавай музыку с помощью искусственного интеллекта * Claude Claude Sonnet • 4 - Новейшая языковая модель огдлепторю Пшвтыа «о 0НДЫ цныыдс ты .«уьхы1«л*оо«салии«е О kecraft Reef art 3 - Новые модели для обработки изобраокеыий OpenAi GPT 4.1 - Самая прод винутая модель от OpenAi с поддержкой зрения и анализа изооражемы Рис 4.1. Главная страница Чтобы приступить к написанию музыки, выбираем пункт Бапп. Откроется страница, изображенная на рис. 4.2. 5ипп может генерировать музыкальный контекст в простом и расширенном режимах. Выбор осуществляется щелчком мыши на соответствующей позиции; по умолчанию предлагается про- стой режим (он выделен темным на рис. 4.2). Если переместить переключатель «Инструментал» в рабочее положение, то будет сгенерирована инструментальная композиция. Если же нужно создать песню с текстом, опцию следует отключить. Это положе- ние предлагается по умолчанию, см. рис. 4.2. В текстовом поле с клавиатуры вводится запрос на написание музыки. Справа внизу отображается количество введенных/остав- шихся символов (на рис. 4.2 поле пустое, введенных символов О, оставшихся 200). Чтобы запустить процесс создания компози- ции, нажмите кнопку «Сгенерировать». Через несколько минут вы получите два варианта мелодии (песни), при этом с баланса автоматически спишется сумма за их создание. 11Б
Пишем музыку с гшмощью нвйрасЕти 5ипа Твой персональный композитор * Suno Простой режим Расширенный режим музыку и песни по описанию Ч1 Инструментал .ВОЙ iSKkl »3 5 Опишите вашу музыку 0/200 ►j? Сгенерировать Стоимость 24 Р (за 2 треде) Рис. 4.5. Интерфейс нейросети Зипо Интерфейс нейросети при работе в расширенном режиме показан на рис. 4.3. Suno - Музыка v Твой персональный композитор ** Mureka Простой режим Создавайте инструментальную музь^уилес^поогмсэнию Расширенный режим Создавайте песни, испольэуя свой текст О Инструментал Наименование ♦/] Сгенерировать Стоимость 2* ₽ (» 2 трека) Рис Ч Э Инн ерфвйс Бипо в расширением режиме 117
ГЛАВА Ц «А музыка звучит» . Учимся создавать мелодии с помощью ИИ Здесь основная особенность — возможность писать песни на основе уже готового текста, который вводится в левом тек- стовом поле; его можно ввести вручную или вставить из буфера обмена. Объем материала может составлять до 3000 символов, чего достаточно даже для большой песни. В правом поле можно указать жанр, щелкнув по нужной по- зиции (pop, jazz и т. д.). Ниже находится еще одно текстовое поле, в котором вводится произвольное имя создаваемой композиции. Процесс можно запустить кнопкой «Сгенерировать», Предвари- тельно стоит убедиться, что на балансе есть достаточная сумма; в противном случае нейросеть откажет в создании мелодии. Независимо от выбранного режима работы написанная музыка будет доступ на для прослушивания и скачивания. Что учесть при создании музыки в нейросети Sunn Выше мы уже отмечали, что родный язык этой нейросети является английский. Именно на нем она наиболее адекватно трактует полученные запросы и пишет песни. Русский язык поддержи- вается на достаточно хорошем уровне, но нужно внимательно писать промпты. Стоимость генерации музыки хоть и небольшая, но списывается за каждый результат, в том числе неудачный. За- ранее продумайте, как вы видите будущую композицию, какие инструменты хотели бы задействовать, какой вариант аранжиров- ки вас устроит и т. д. Это позволит быстро получить требуемый результат и минимизировать расходы. При работе в расширенном режиме есть правила, которые нужно соблюдать, если вы ходите написать музыку на уже готовый текст песни. Вводить его в левое текстовое поле (см. рис. 4.3) нужно с использованием специальных меток для куплетов и припева согласно следующему алгоритму: ► [Куплет 11 ► Содержимое первого куплета ив
Пишем музыку с помощью нейросети 5ont: ► [Припев! ► Содержимое припева ► [.Куплет 2J ► Содержимое второго куплета ► [Припев2 ► ИТ. д. Это поможет ИИ правильно понять структуру создаваемой композиции, сделать ее максимально органичной и естественной. Музыкальный чат-бот 5ипа в Telegram Нейросеть 5ипп представлена в мессенджере Telegram. До- ступ к ней осуществляется с помощью многофункционального Telegram-бота Syntx Al (@syntxaibot): в нем также есть инструменты ИИ для синтеза речи, работы с видео и графикой, и пр. Главный интерфейс бота 5yntX AI представлен на рис. 4.4. В целом порядок работы прост и интуитивно понятен; он аналогичен использованию многих других Telegram-ботов, рабо- тающих на основе технологий ИИ. Одна из его особенностей — довольно мощная и содержательная база знаний: она вызывается нажатием соответствующей кнопки (см. рис. 4.4). В ней подробно описаны функционал и режимы работы, что актуально для начи нающих пользователей. Каждому новому пользователю предоставляет- ся 5,5 токенов. Этого хватит для генерирования пары небольших музыкальных композиций, предварительного знакомства и оценки функ- ционала. Для дальнейшей работы с нейросетью необходимо приобрести подписку и купить токены — это делается в профиле пользователя. Есть несколько тарифных планов, чтобы подо- брать вариант, оптимальный по функционалу и стоимости. цд
ГЛАВА ч «А музыка звучит» . Учимся создавать мелодии с помощью ИИ Syncx AI 292 150 пользователей в месяц .Xi ♦ Начислено 5.50 токенов для ознакомления с чат-ботом. Ф Наше сообщество Что может делать этот бот? Генерируйте в Sora, ding, MiшМах. RunWay, Luma, MjdJoumey, DALL-E 3, IdeoGram. Flux, сочиняйте музыку, синтезируйте речь, генерируйте звуки, общайтесь с CnaeGPT-ol- рто. Claude, Gemini и еще 70 ИИ а Вашем кармане О < Чтобы узнать больше о своем аккаунте и тарифах, нажмите кнопку ’Профиль’ снизу, а главном меню чат-бота. 22*59 О Служба поддержки Рис. ч Ч. Главный интерфейс бита Syntx Al Еще один важный момент: авторские права на все песни и инструментальные композиции, созданные с помощью Suno в боте Syntx Al, полностью принадлежат пользователю. Он вправе размещать их на стриминговых площадках, продавать, дарить, включать в качестве саундтрека в видеоролики, делать музыкальное сопровождение рекламы, использовать в иных личных и коммер- ческих целях. Также при создании музыкальных произведений необходимо учитывать следующее: ► 5ипо исключает работу с любым контентом, который может трактоваться как оскорбительный, запрещенный или некор- ректный. Нельзя писать музыкальные материалы и промпты, в которых упоминается дискриминация по национальному, расовому или любому другому признаку, содержатся призывы 150
Пишем музыку с памятью НЕйрисвти 5unt: к насилию, а также слова и выражения, использование кото- рых не допускается здравым смыслом, правилами приличия и нормами общественной морали. ► Нельзя создавать песни, содержащие имена известных лично- стей и знаменитостей. Попытка сгенерировать такое окажется неудачной, И 1/1 выдаст сообщение об ошибке. Это сделано, чтобы не допустить недоразумений, спорных и конфликтных ситуаций с людьми, которые не давали публичного согласия на использование своего имени и фамилии в музыкальных произведениях. Чтобы генерировать песни и инструментальные композиции в боте 5yntxAI, музыкальное образование и знание нотной гра- моты не требуются. Все делается в диалоговом формате путем ввода запроса и дополнительной детализации задания (стиль, текст, жанр и. пр.). Пользователь просто описывает, что он хочет получить: все остальное делает за него ИИ, причем на создание композиции уходит, как правило, не больше нескольких минут. Даже если с первого раза результат не полностью оправдывает ожидания, можно уточнить и дополнить запрос — и в конечном итоге пользователи получают то, что нужно. Переход в режим генерирования музыкальных произведений осуществляется из главного меню нажатием кнопки <^АуЭио с ИИ» (см. рис. 4.4). В результате отобразится меню, которое показано на рис. 4.5. £ Меню) |Сообщение... □ Ф © Синтез речи 99 Клонирование голоса 4-' SUNO (музыка) Видео в аудио if Генератор звуков f Аудио в текст _ о Л, Профиль В главное меню Рис Ч 5. Меню для работы со звукам 151
ГЛАВА Ч «А музыка звучит» . Учимся создавать мелодии с помощью ИИ В меню нужно выбрать пункт «SUNO (музыка)». Отобразится интерфейс, как на рис. 4.6. * SUNO (музыка) Выберите режим в меню "Настройки SUNO" и отправьте запрос, SYNTX сгенерирует композицию! Или загрузите Вашу композицию длинной 10-60 секунд и продлите ее, используя тот же голос и манеру Тариф: 4" 2.00-3.00 ( SUNO передаст 2 версии композиции, а Рис. Ч Б. Переход в режим раБзты с нейрпсетью Sun Здесь с помощью кнопки «Профиль» можно перейти в ре- жим просмотра профиля и пополнения баланса. Пункт «База знаний» предназначен для изучения справочной информации: там рассказывается о режимах работы, доступных инструмен- тах, правилах генерирования музыкального контента. Команда «Главное менЮ'> позволяет вернуться в стартовый интерфейс программы (см. рис. 4.4), а пункт «Назад» — к предыдущему окну (см. рис. 4.5). Чтобы приступить к работе с 5ипп и начать генерировать музыкальные композиции, выберите пункт «Настойки модели» (см. рис. 4.6). На экране отобразится окно, в котором задаются параметры будущего музыкального произведения (рис. 4.7). В Telegram-версии SuriD предусмотрены три режима написания ^музыки: пользовательский, стандартный и инструментальный. Рассмотрим порядок работы с каждым из них. 152
Пишем музыку с помощью нейрисвти 5ипа Syntx Al Настройки SUNO ¥ В SUNO существует два режима.- 1. Пользовательский - выбор стиля (здесь, в приложении) и • указание текста для песни (в чате с ботом при создании запроса). Если не указывать стиль, будет использован случайный. • 2. Стандартный - создание музыки по Промпту при помощи ОРТ (в • чате с ботом и разделе SUNO при создании запроса) + функция генерации композиции без слов Модель: V4 О 4- S.CO Пользовательский режим Введите стили произведения вручную или выберите один/ несколько из предложенных Сохранить Очистить Drake HipHop • Trap • male vocals • Funk • Dance Pop • Groovy Bruno Mars male vocals Fleetwood Мас • Classic Rock • Mellifluous Рис. Ч 7 Настройка нейрзсети Suna для генерации музыки (пальзавательский режим} 153
ГЛАВАМ «А музыка звучит» Учимся создавать мелодии г помощью ИИ В поле «Модель» отображается текущая версия ИИ, а также стоимость создания композиции в соответствии с текущими настройками. На рис. 4,7 за генерирование музыки с баланса спишутся три токена. Напомним, что новым пользователям бесплатно предоставляется 5,5 токенов. По умолчанию ИИ предлагает генерировать музыку в пользо- вательском режиме (рис. 4.7). В текстовом поле нужно указать свои пожелания по стилю (максимальное количество символов — 1200). Их можно выбрать щелчками мыши из списка, расположенного под кнопками «Сохранить» и «Очистить» (на рис. 4.7 выбраны стили HipHop и Funk). Этот перечень достаточно обширный, в нем можно выбрать не только стили и жанры, но и музыкальных исполнителей (Elton John, Lady Gaga, AC/DC и др.), творчество которых нужно учесть. Но напрямую вписывать имена испол- нителей запрещено; в таком случае нейросеть выдаст сообщение об ошибке и создание музыки будет невозможно. А вот вписывать вручную стили разрешено. Также можно вообще не указывать никакой стиль или жанр — в этом случае нейросеть сама определит стилевую направленность композиции. Чтобы зафиксировать выполненные настройки, нажмите кноп- ку «Сохранить». Чтобы удалить их, нажмите «Очистить». Это полезно, например, когда текущие настройки признаны неудач- ными и нужно начать процесс заново. Текст песни отправляется в режиме чат-бота с SyntxAI. Воз- можны следующие варианты: ► сочинение собственного текста с учетом личных предпочтений относительно рифмы, содержания, стихосложения и пр.; ► использование уже готового текста — например, произ- ведения известного поэта, чтобы на его стихи наложить музыку; 154
Пишем музыку с помощью нейросети 5ипс ► генерирование текста песни с помощью текстового чат-бо- та — например, EhatCPT (см. главу 2), доступ к которому есть в SyntxAl; ► комбинированный способ — например, когда часть текста генерирует И И, а остальное дописывает пользователь. Параметры настройки 5ипо в стандартном режиме показаны на рис. 4.8. Syntx Al : X Настройки SUNO ✓ в SUNO существует два режима: |Т. Пользовательский - выбор стиля (здесь, в приложении) и указание текста для песни (в чате с ботом при создании запроса) Если не указывать стиль, будет использован случайный. 2 Стандартный - создание музыки по промпту при помощи GPT (в чате с ботом в разделе SUNO при создании запроса) + функция генерации композиции без слов Модель: Пользовательский режим Инструментальный режим Сохранить Рис. Ч.З. Настройка нейрасети 5ипс для генерации музыки (стандартный режим) 125
ГЛАВАМ «А музыка заучит» Учимся создавать мелодии с помощью ИИ Для перехода в стандартный режим нужно щелчком мыши выключить пользовательский режим (на рис. 4.8 возле него ото- бражается OFF, а на рис. 4.7 ON). В данном случае ИИ не дает выбрать жанр и исполнителей: нужно лишь в режиме чат-бота указать, в каком стиле требуется музыкальное произведение и о чем должна быть песня. В стандартном режиме 5ипп поедъявляет вы- сокие требования к качеству запроса. Если искусственному интеллекту что-то будет непо- нятно, он откажется выполнять задание. Следите за точностью формулировок, вводите запрос так, чтобы он был конкретным, недвусмысленным и понятным. Например, «напиши песню в жанре рок о любви парня к девушке». В инструментальном режиме ИИ создаст музыкальную композицию без текста. Режим включается щелчком мыши (рис. 4.9). Чтобы сгенерировать инструментальную композицию, нажмите «Сохранить» и введите промпт в режиме чат-бота — например, «Напиши мелодию в жанре диско» (рис. 4.10). Аналогично вводятся запросы при работе в пользователь- ском и стандартном режимах —по обычным правилам общения с Telegram-ботом. Разница лишь в содержимом Промпта. При создании инструментальной композиции внимательно составляйте запрос. Так, при вы- боре стиля или жанра нужно писать не «тяжелый рок» или «диско», а «мелодия в стиле тяжелого рока» или «саундтрек в жанре диско». 1ЕБ
Пишем музыку с помощью нвйрпсЕти Зипо Syntx Al Настройки SUNO ф' В SUNO существует два режима: 1. Пользовательский - выбор стиля (здесь, в приложении) и указание текста для песни (в чате с ботом при создании запроса» если не указывать стиль, будет использован случайный. 2 Стандартный создание музыки по Промпту при помощи GPT (в чате с ботом в разделе SUNO при создании запроса) + функция генерации композиции без слов Модель: v4.O ♦ 3.00 Пользовательский режим Инструментальный режим* ON ф ф SUNO (музыка) Сохранить Рис Ч 9. Инструментальный режим (переключатель в положении EN> Выберите режим в меню 'настройки SUNO" и отправьте запрос SYNTX сгенерирует композицию! или загрузите вашу композицию длинной io-ъо секунд и продлите ее, используя тот же голос и манеру 4 Тариф: 2.00-З.С0 (Jfp SUNO передаст 2 версии композиции, а значит 2 аудио файла за эту стоимость). Меню напиши мелодию в жанре диско м Настройки модели X Профиль Ц База знаний ». В главное меню Q Назад Рис. Ч .!□ Е'вод запроса (Промпта) для создания инструмрнтальной композиции 157
ГЛАВА Ц «А музыка звучит» .. Учимся создавать мелодии с помощью ИИ Если вы хотите написать песню, то оптимальная структура текста будет выглядеть примерно так: ► вступление; ► первый куплет; ► припев; ► второй куплет; ► мостик (например, в виде музыкального проигрыша; этот прием часто используется в стилях хип-хоп, поп, разных направлениях рок-музыки и пр.); ► припев; ► финальная часть. Именно в таком виде следует вставлять текст песни при форми- ровании запроса, при этом четко указывать каждый фрагмент (где именно куплет, где припев и т. д.). Так ИИ максимально адекватно воспримет задание, и можно будет получить требуемый результат если не с первой, то после минимального количества попыток. Иногда нейросеть неправильно расставляет ударения в сло- вах. Можно дать ей подсказку с помощью следующих способов: ► вставка апострофа после буквы, на которую должно быть ударение (например, «фантазируй — фантази'руй», «ле- тай — лета'й», «побеждай — побеждай» и т. д.); ► повторение ударной буквы («фантазируй — фантазииируй», «летай — летааай», «побеждай — побеждааай» и т. д.); ► написание ударной буквы в заглавном виде («фантазируй — фантазируй», «летай — летАй», «побеждай — побеждАй» и т. д.); ► расстановка ударений («фантазируй — фантазируй», «ле- тай — летай», «побеждай — побеждай» и т. д.). Можно пробовать все способы по очереди или совмещать один с другим — многое зависит от конкретного текста. 15В
Пишем музыку с помощью нейросети 5una Каждая сгенерированная композиция предлагается в двух вариантах. Можно выбрать песню (мелодию), которая наиболее соответствует ожиданиям. На созданный контент предоставляется ссылка (рис. 4.11), по которой его можно прослушать и скачать. Меню Риг. Ч 11. Ссылка на скачивание сгенерированной музыки Написать сообщение... Также отображаются основные параметры создания музыкаль- ной композиции в соответствии с предварительно заданными настройками (стиль, режим генерирования, продолжительность). В Зипо можно продлевать ранее созданные композиции. На- пример, вы сгенерировали песню продолжительностью две минуты из двух куплетов и припева, а затем решили добавить еще один куплет и мостик, а после них еще раз вставить припев. Возможны разные варианты, причем для всех режимов — пользовательского, стандартного и инструментального. Также можно сочетать разные режимы: например, изначально композиция была написана в поль- зовательском режиме, а затем вы решили дополнить се музыкой без слов — тогда можно продлить ее в инструментальном режиме. Функция продления музыкальных композиций доступна только для пользователей, купивших тарифы BASIC, PRO или VIP. is g
ГЛАВА Ч «А музыка звучит» Учимся создавать мелодии с помощью ИИ Чтобы перейти в этот режим работы, нажмите кнопку «Про длить композицию» (см. рис. 4.11). Далее укажите момент, с ко- торого вы хотите продлить произведение (например, 01:15 это минуты и секунды от начала композиции), и указать ее параметры (добавить текст, выбрать стиль и пр.). После завершения опера- ции можно сохранить отдельно продленный вариант или сразу соединить новую запись с прежней, получив другой трек. Создаем музыкальные произведения с помощью Riffusion На момент написания книги нейросеть Riffusian — один из но- вейших инструментов для генерирования музыкальных произ- ведений: публичная бета версия появилась в январе 2025 года. Сервис работает по адресу: https://www.rifrusion.com как веб-ресурс, поэтому ничего скачивать не нужно — достаточно обычного браузера. Хотя интерфейс и инструменты англоязычные, разобраться с ними легко, а поможет вам в этом информация, с которой мы предлагаем ознакомиться далее. Основные преимущества нейросети Refusion Сервис абсолютно бесплатен — по крайней мере, на момент на- писания книги. Не исключено, что в дальнейшем разработчики предложат несколько платных тарифов под разный функционал и бюджет: это распространенная практика после того, как про- дукт станет популярным и обретет постоянных пользователей. Но изначально Piffusion работает в свободном доступе. Прочие преимущества: ► Отсутствие территориальных ограничений. Сервис открыва- ется без VPN и прочих анонимайзеров. Если вы захотите зарегистрироваться через телефон с помощью СМС (кро- пи
Создаем музыкальные произведения с помощью Piffusion ме этого, можно использовать учетную запись Gmail или Discord), то код доступа придет даже на российский номер. ► Широкие возможности для персонализации. И 1/1 быстро обучается на потребностях конкретного пользователя. Это позволяет в предельно сжатые сроки максимально настроить нейросеть под себя. ► Создание полноценных треков. Этим Riffusion выгодно отли- чается от некоторых других нейросетей для генерирования музыки, которые вместо завершенных записей предлагают откровенно незаконченные обрывки. ► Возможность много и интересно экспериментировать. Пред- усмотрены такие фишки, как смешивание жанров, добавление разнообразных спецэффектов, переработка старых записей, создание саундтреков для видеороликов и онлайн-игр, прод- ление и редактирование композиций, и пр. ► Отсутствие требований к музыкальному образованию и зна- нию нотной грамоты. Для создания музыкальной компози- ции достаточно ввести текстовое описание (лучше делать это на английском, но Riffusion понимает и русскоязычные промпты) и при желании задать дополнительные параме- тры (жанр, ритм и пр.). Также можно генерировать музыку на основе загруженных аудиозаписей. ИИ Riffusion универсален и может использоваться для реше- ния разноплановых задач. Поэтому он популярен у специали- стов разного профиля: продюсеров, композиторов, битмейкеров, аранжировщиков, создателей рекламной музыки, блогеров и пр. Riffusinn отлично подходит для новичков, делающих первые шаги в сфере написания музыки с помощью ИИ: сгенерировать несложную музыку можно за несколько минут. Описание пользовательского интерфейса После перехода на страницу https://www.rittusion.com откроется главный интерфейс нейросети, изображенный на рис. 4.12. 131
ГЛАВА Ч «А музыка звучит» . Учимся создавать мелодии с помощью ИИ <3 Riffuslon мм <2} Create the music you imagine... ♦: Generate Q. Search A Home S Wxary в Projects 4f PteyMts Person*» Featured playlists Pi4a YaDipeto [Stem « ThvSovnmeh GacfMdOupi • s мгф* A J«lr Attar Wn«t0*d 7 ungs C,bu 1л -11 TMJ hop, Rep. IRSB £9 invite friends C Docs ffl Discord (f Цремм = ««cod & о Staff picks v You’re the Drug > DHP42O wt*p« *ound you im* *мт Ал teetftMaifpa OM.Ok О1» *« Q? — Мрсхпя the Switch Рис. 4 IB. ГлпанО|й интерфейс Riffusmn Riffusinn можно использовать не только для создания музы- кальных композиций, но и как стриминговый сервис. Это означает, что пользователи могут слушать записи друг друга и обмениваться сгенерированными треками. Для использования сервиса нужно зареги- стрироваться и авторизоваться. Как отмечалось выше, есть три способа: по телефону с исполь- зованием СМС-кода, через аккаунт Google или ученую запись Discord Р любом случае процесс несложен и занимает максимум несколько минут. Зарегистрированным пользователям доступен весь функционал Riffusinn без ограничений. В левой части интерфейса находится несколько вкладок, с помощью которых выбираются режимы работы с нейросетью. По умолчанию открывается вкладка Ноте (ее содержимое по- казано на рис. 4.12): именно здесь генерируется музыкальный контент. Ее содержимое мы рассмотрим позже, а пока кратко ознакомимся с назначением остальных вкладок: ► Library— в этом разделе находится хранилище сгенери- рованных пользователем песен, музыкальных композиций и прочих треков, а также созданных им плейлистов. 135
Сьздаем музыкальные произведения с помощью Piffusion ► Personalize — раздел предназначен для обучения 1/1 И предпочтениям и вкусам пользователя. Благодаря этому в дальнейшем нейросеть сможет предлагать максимально релевантные промпты для создания музыкальных компози- ций, а также точно и корректно исполнять запросы. Принцип обучения построен на базе игровой механики: для повышения уровня необходимо выполнять на сервисе различные дей- ствия— например, ставить лайки нате или иные композиции, выбирать треки для прослушивания и пр. ► Playlists — раздел предназначен для хранения плейлистов, созданных пользователем. Он может делиться ими с другими клиентами сервиса и получать их плейлисты. ► Project — здесь пользователь может создавать и хранить собственные проекты — например, наиболее часто исполь- зуемые промпты или готовые шаблоны произведений. ► Invite Friends— раздел предназначен для приглашения других пользователей к работе с Riffusiun. При переходе на вкладку отображается окно, в котором предлагается скопировать ссылку на ресурс в буфер обмена. ► Docs развернутая и довольно подробная справочная система. В ней описаны все разделы и режимы работы, но весь материал изложен на английском языке. Слева внизу интерфейса находится вкладка, которая назы- вается по имени пользователя (на рис. 4.12 это arcod). Раздел предназначен для просмотра и редактирования профиля поль- зователя, а также настройки некоторых параметров интерфейса. Щелчок мышью по вкладке открывает меню, изображенное на рис. 4.1 3. С помощью команды View profile осуществляется переход в ре- жим просмотра информации о профиле. Здесь можно изменить имя пользователя, увидеть информацию о количестве подписчиков и подписок, лайков и пр. Подменю Theme позволяет выбрать тему оформления интерфейса: Light (светлая), Dark (темная) и System 133
ГЛАВА 4 «А музыка звучит» . Учимся создавать мелодии с помощью ИИ (системная, предлагаемая по умолчанию). С помощью команды Moderate Lyrics в подменю Settings можно включить режим авто- матической модерации текстов создаваемых песен. Д View profile Э Theme System > < Model FUZZ-0.8 > @ Settings > © Learn more > Log oul Рис, 4 13 меню работы с профилем пользователя Для получения дополнительной информации о Riffusian пред- назначены команды, которые находятся в подменю Learn тоге. С их помощью осуществляется переход на страницу платформы в социальной сети, в ее блог и на другие ресурсы. Процесс создания музыки Чтобы приступить к генерированию музыкального контента, перейдите на вкладку Ноте и щелкните мышью в рабочем поле (на рис. 4.12 в нем отображается текст ^Create the music you imagine»). В результате оно примет вид, как на рис. 4.14. Prompt Compose Create the music you imagine.. Random Instrumental Or X E3 Ado to project Generate Рис 4 14 Создание музыки в режиме Prompt 134
Создаем музыкальные произведения о помощью Piffusion Возможности нейросети предусматривают создание музы- кальных произведений в двух режимах — Prompt и Compose. Рассмотрим порядок работы в каждом. Режим работы Prompt показан на рис. 4.14 (вкладка с его на- званием находится слева вверху, и она подчеркнута). В данном случае ИИ сгенерирует музыку на основании только текстового описания (промпта). Если вы совсем не знаете английского, можно переводить тексты и создавать запросы с использованием онлайн-перевод- чика (например, от Google или Яндекс). Как правило, несложные и небольшие тексты он переводит корректно. К примеру, русско- язычный запрос «напиши песню в стиле рок про парня, который очень любит девушку» переводчик от Google переведет как «write a rock song about a guy who loves a girl very much»; такой запрос Rlffusion поймет. Если же и такой вариант для вас затруднителен, пишите промпты на русском языке. Чтобы сформулировать максимально точный запрос, включите в него следующую информацию: ► стиль и жанр музыкального произведения: поп, электронная музыка, джаз, рок, фолк, регги и пр.; ► музыкальные инструменты, которые необходимо задейство- вать: саксофон, фортепиано, ударные, гитара, скрипка, аккордеон и т. д.; ► настроение и темп (БРМ) произведения — от этого зависит его скорость и ритм, возможные варианты — меланхоличный, энергичный, спокойный, романтичный и пр.; ► дополнительные эффекты — эхо, повторение, реверберация. Они позволят украсить музыкальную композицию, придать ей особенное, неповторимое звучание, а также органично расставить акценты. Если вы планируете создать инструментальное произведение без текста, включите опцию Instrumental (по умолчанию она отключена, 135
ГЛАВА Ч «А музыка звучит» . Учимся создавать мелодии с помощью ИИ см. рис. 4.14). Что касается написания текста песни, то при создании промпта рекомендуется использовать следующие элементы структуры (она лучше воспринимается Riffusian, пример показан на рис. 4.20): ► [Into] (вступление); ► [Verse 1] (первый куплет); ► [Pre-Chorusl (пре-припев); ► [Chorus] (припев); ► [Bridge] (мост, переход); ► [Solo] (проигрыш на каком-либо инструменте — например, гитаре или фортепиано); ► [Verse 2] (второй куплет); * и т. д. При необходимости структуру можно корректировать (напри- мер. убрать пре-припев или переход), но обозначать элементы следует в квадратных скобках. Если вообще не указывать структуру песни, ИИ составит ее по своему усмотрению. Чтобы запуст ить создание песни, введите промпт в рабочее поле и нажмите кнопку «Generate» (см. рис. 4.14). В среднем про- цесс генерации треков занимает около 30 секунд, но время может варьироваться в зависимости от сложности и специфики запроса. По каждому запросу Riffusian создает два варианта полноценного музыкального произведения. Можно выбрать поправившийся или использовать сразу две версии. Оба варианта будут автоматически помещены в раздел Library (рис. 4.15). Q Riffuston м т» ♦I Generate 0 мот* {jO Ubrry @ Preset* «У ИауИи Library ф Prompt write a rock song about a guy who loves a girt very much Рис. 4 15. Сгенерираданныр музыкальные композиции 13 Б
Создаем музыкальные произведения г помощью Piffusion Для каждого произведения ИИ придумает название и создаст обложку. Сгенерированные композиции можно прослушать, а так- же выполнять с ними разные действия с помощью команд, кото- рые открываются при нажатии на пиктограмму с тремя точками в правой части интерфейса напротив произведения (рис. 4.16). Library ► songs V Playlists О Favorites « Li trie Things Pock mid-tempo heartfelt, melodic powerchords, emouotui builds Free Rock metod-c power baud, soaring gulls' solos, cmotlontf dynamics X Remix > & Edit details <S> Privacy Link only > go Copy link 6 Add to project > + Add to playlist > := Ada to queue tkownload > -4 Get stems P керой > О Delete Рис Ч.1Б Мрню для работы с музыкальной композицией Если вы хотите изменить название или обложку произведе- ния, предложенные по умолчанию, выберите команду Edit details. Откроется окно, изображенное на рис. 4.17. Little Things X Update Рис. 4.17. Изменение оБложки и названия композиции 137
ГЛАВА Ц «А музыка звучит» .. Учимся создавать мелодии с пdмощью ИИ Здесь можно загрузить с компьютера или внешнего носителя любую картинку для обложки. Чтобы изменить название песни, введите его с клавиатуры в текстовом поле. Для сохранения из- менений нажмите кнопку Update. Команда Privacy настраивает приватность композиции. Воз- можны три варианта: ► Only me — произведение будет видно только вам; ► Anyone with the link — всем пользователям нейросети, у которых есть ссылка; ► Publish — всем желающим. Для копирования ссылки на произведение в буфер обмена воспользуйтесь командой Copy link, для добавления грека в про- ект или плейлист — командами Add to project и Add to playlist (см. рис. 4.16). Для скачивания композиции используйте пункт Download. Нейросеть предложит зри формата - MP3, М4А или WAV. Чтобы удалить музыкальное произведение, воспользуйтесь командой Delete. Будьте внимательны: нейросеть не попросит подтвердить операцию. При переходе в режим Compose (рис. 4.18) нейросеть пред- лагает более широкие возможности для работы с музыкальными произведениями. В поле Lyrics вводится текст песни; это можно сделать с клави- атуры или вставить из буфера обмена. При отсутствии материала или нежелании создавать его самостоятельно можно поручить эту задачу ИИ. Нажмите кнопку Ghostwriter, и откроется небольшое окно (рис. 4.19). В окне введите произвольное описание текста будущей ком- позиции. Нейросеть понимает русский язык, но задание будет выполнено точнее, если составить промпт по-английски. Можно ввести подробное развернутое описание или составить его кратко, в двух словах — например, «song about, love», или еще проще — «love song<>. Но чем подробнее вы напишете промпт, тем точнее 13Б
Создаем музыкальные произведения г помощью Piffusion будет результат. Это особенно актуально для ситуаций, когда вы пишете не просто развлекательную песню или трек-сопровождение для видеоролика, а произведение по какому-либо поводу — на- пример, поздравление юбиляру. Prompt Compose v Lyrics Instrumental (j Aoo lyrics... fr Ghostwriter V Sound Advanced (J Describe the sound... 0* Acoustic guitar strums Chill vibe Jazzy solo Anxious Wistful meloo-es Whistling melody Vitxanl v Details Add title (optional).. Q Upload image О Prompt image Upload e Add to project Рис 4 IF Создание музыки в режиме Compose Ghostwriter What should the lyrics be about? Write for me Рис 4 19 Bb.ia описания текста песни Чтобы запустить процесс генерации текста, нажмите кнопку Write for те (см. рис. 4.19). Сгенерированный текст отобразится в поле Lyrics (рис. 4.20). При желании вы можете отредактировать текст вручную. В среднем создание текста по запросу длится несколько минут; время генерации может зависеть от сложности задания и текущей нагрузки на серверы. 139
ГЛАВАМ «А музыка звучит» Учимся создавать мелодии с помощью ИИ Prompr Compose v Lyrics [Verse 11 Tapping keys against your leg Cotfee stains on notebook pages Half-smiled glance across the room Humming tunes I almost knew |Pre-chorus] Your fingers trace invisible lines While speaking on the phone And somehow I keep tracking time By habits not my own [Chorus] The more I try not to notice, the more that I do Every gesture tells a story I’m trying not to read into The more I try not to notice, the more that I do CT * Instrumental & Ghostwriter Рис ЧЕТ. Сгенерированный текст песни (фрагмент) пп запр тсу «Inve song» Текст песни сгенерирован в соответствии со структурой, которую мы подробно рассмотре- ли ранее: в нем есть куплет [Verse 1], пре-припев [Pre-chorus] и припев [Chorus], причем название каждого элемента заключено в квадратные скоб- ки []. Такого принципа следует придерживаться и при самостоятельном написании текста. В поле Sound (см. рис. 4.18) вводится описание создаваемого произведения. Можно указать любые пожелания: темп, настрое- ние (романтичное, боевое, веселое и т. п.), жанр, стиль, звуковые эффекты и другие особенности. Предлагаются два варианта ввода описаний: вручную или автоматически. В первом случае текст вводится с клавиатуры, во втором — с помощью расположенных ниже кнопок (рис. 4.21). 14D
Создаем музыкальные произведения г ломощью Piffusion Sound Advanced t>csuiibc the souna... sound prompt I Chill vibe Jazzy solo Anxious Wistful melodies Whistling melody Vibrant Passionate Smooth Рис 4 51. Кнопки для автоматического ввода описания композиции При нажатии кнопки (например. Jazzy solo) соответствующее значение автоматически подставится в текстовое поле, а сама кнопка исчезнет из перечня. С помощью кнопки Random sound prompt (ее название отображается в виде всплывающей подсказ- ки при наведении указателя мыши, см. рис. 4.21) можно быстро сгенерировать случайное описание песни. При этом ИИ будет руководствоваться ранее заданными настройками, текстом песни, а также предпочтениями пожеланий пользователя, информацию о которых он ранее получил в процессе самообучения, в том числе с помощью сведений в разделе Personalize. Можно и более тонко настроить будущее произведение. Для работы с ними включите опцию Advanced — откроются допол- нительные параметры (рис. 4.22). v sound Strength Jazzy solo, + Aad sound Lyrics strength Weirdness Рис 4.55. Дополнительные параметры настройки музыкального произведения Здесь по-прежнему доступно поле для текстового описания будущей композиции (на рис. 4.22 в нем отображается значение Jazzy solo, его можно дополнятъ/редактироватъ). С помощью кнопки +Add sound при необходимости добавляются новые ана- логичные поля, в каждом из которых вводится свое описание. Для каждого такого поля справа доступен ползунок Strength, с помощью которого настраивается точность соответствия и огра- 141
ГЛАВА Ц «А музыка звучит» .. Учимся создавать мелодии с помощью ИИ ботки запроса в создаваемой композиции. Например, если в одном текстовом поле ввести «Romantic» (романтический), а в другом <<Sad» (грустный), то можно ползунком настроить музыкальную композицию следующим образом: она будет максимально ро- мантичной (ползунок перемещается вправо) с легким оттенком грусти (ползунок левее центрального положения). С помощью ползунка Lyrics strength можно указать, насколько точно генерируемая мелодия должна соответствовать тексту про- изведения. Ползунок Weirdness позволяет определить, насколько специфическим, экспериментальным и нестандартным будет звук. Выше мы отмечали, что Riffusiun на момент написания книги не генерирует тексты на рус- ском языке. Но воспроизвести русскоязычный текст а виде речи (вокал в песне) она может. При этом возможны некоторые проблемы с произ- ношением: например, ИИ не всегда правильно расставляет ударения в русских словах, а также испытывает проблемы с воспроизведением звуков, не характерных для англоязычной речи (например, «р»). В режиме Compose можно экспериментировать с загружен- ными в нейросеть треками. Например, сделать кавер-версию музыкального произведения, заменить один или несколько фрагментов, продлить композицию, добавить звуковые эффекты (мощный бас, парящее гитарное соло, импровизация на саксо- фоне и пр.). Чтобы запустить процесс генерации, нажмите кнопку Generate (см. рис. 4.18). Как и в режиме Prompt, ИИ выдает по каждому заданию два варианза музыкального произведения. Каждый из них можно скачать, сохранить в библиотеке, добавить в проект для последующего использования в качестве образца при создании новых произведений, а также использовать в других целях.
ГЛАВА 5 ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ КАК ПОМОЩНИК, СОБЕСЕДНИК И ДРУГ Решения на базе ИИ могут использоваться в качестве вирту ального приятеля. Действительно, современная модель нейросети и хорошая платная подписка позволяют получить практически идеального электронного друга, который отличается от живого человека лишь тем, что существует в цифровом виде и не наделен настоя- щими эмоциями (хотя способен их имитировать). С ним можно пошутить и посмеяться, поделиться наболевшими проблемами, получить совет в трудной жизненной ситуации, обсудить новый фильм или последние новости, вместе посмотреть футбольный матч и поболеть за любимую команду, и т. д. В чем поможет виртуальный друг Есть модели, которые можно использовать в качестве полноценно- го психолога. В их числе, например, чат-бот нейросети Wysa. Он официально прошел клиническую проверку и создавался с уча- стием сертифицированных специалистов, благодаря чему может оказывать психологическую помощь в соответствии с протоколами 143
ГЛАВА 5 Искусственный интеллект как помощник, собеседник и друг когнитивно-поведенческой терапии. Правда, эта нейросеть пока работает только на английском языке. Помимо общения и получения психологической помощи, виртуальные помощники могут использоваться для решения широкого спектра других задач, в числе которых: ► поиск информации в Интернете, включая прогнозы погоды, прокладывание маршрутов, перевод текстов; ► контроль своего здоровья — виртуальный друг подсчитает калории, количество пройденных шагов, проконтролирует качество сна, найдет информацию медицинского, восста- новительного, реабилитационного характера; ► уход за детьми — «умная» колонка расскажет ребенку сказку, споет колыбельную песню, выполнит функции радионяни (на- пример, сообщит родителям о том, что ребенок расплакался или просто зовет маму); ► обеспечение безопасности, включая управление охранной сигнализацией, вызов служб экстренного реагирования, предупреждение домочадцев о нештатной ситуации, помощь в поиске утерянного мобильного телефона, пульта, планшета и других девайсов; ► помощь в обучении — голосовой ассистент поможет с ос- воением иностранного языка, найдет решение математиче- ской задачи, предложит пройти увлекательные и полезные тесты, ответит на вопросы практически по любым темам, окажет содействие с проверкой домашних заданий у ре- бенка; ► развлечение виртуальный друг расскажет о последних новостях, включит любимую музыку или кинофильм, прочтет аудиокнигу, станет напарником для игр; ► решение текущих бытовых вопросов — составление списков покупок и важных дел, отправка писем и сообщений, плани- рование встреч, внесение заметок, настройка будильников и напоминаний, и т. д. 1ЧЧ
Виртуальный помощник «Алиса» Это далеко не полный перечень задач, которые можно решать с помощью виртуальных помощников. Многое зависит от кон- кретной модели нейросети, потребностей пользователя и других факторов. К тому же ИИ постоянно обучается, и сегодня никто не может предположить, с какими функциями он научится справ- ля гься в ближайшие несколько лет. На бытовом уровне он уже сегодня способен решать многие задачи, которые еще недавно считались прерогативой исключительно человека. Сегодня есть множество платных и бесплатных виртуальных помощников от разных производителей, с поддержкой разных языков, функций, предназначенных для решения широкого спек- тра задач. Далее подробно познакомимся с одним из наиболее популярных в России ассистентов — «Алисой», а затем рассмотрим еще несколько аналогичных продуктов. Виртуальный помощник «Алиса» Ассистент «Алиса» — самый популярный виртуальный помощник в России. Он разработан сервисом «Яндекс», доступен для зареги- стрированных пользователей и предлагается в разных вариантах исполнения: ► мобильное приложение (устанавливается на любые совре- менные смартфоны и планшеты); ► виртуальный ассистент, встроенный в интернет-обозреватель «Яндекс» («Алиса» есть и в десктопной, и в мобильной версиях); ► умная колонка, используемая как отдельный девайс и подклю- ченная к Интернету (есть несколько моделей, различающихся по дизайну, функциональным возможностям и стоимости). Далее рассмотрим порядок работы с каждым вариантом. Нач- нем с мобильного приложения и виртуального ассистента браузера «Яндекс», а затем познакомимся с умной колонкой «Алиса». 145
ГЛАВА 5 Искусственный интеллект как помощник, собеседник и друг Мобильное приложение «Алиса» и виртуальный ассистент в браузере Мобильное приложение и виртуальный ассистент «Алиса» могут выступать в качестве голосовых помощников и собеседников, а также использоваться в режиме чата. Работа ведется стандартным образом: пользователь дает запросы и получает на них ответы. Например, можно попросить совета — как поступить, если внезапно потерял работу (рис. 5.1), или попросить рассказать свежий анекдот. посоветуй, что делать, если уволили с работы Если вас уволили с работы, вам следует предпринять следующие шаги 1. Изучите законодательство и свои права. Убедитесь, что увольнение было законным. 2. Соберите все необходимые документы (трудовой договор, приказы, с правки и т. д.). 3 Обратитесь в службу занятости для получения статуса безработного и пособия по безработице. 4. Рассмотрите возможность получения финансовой помощи от государства или работодателя (если возможно}. 5. Составьте резюме и начните активно искать новую работу. 6. Развивайте навыки и компетенции, чтобы повысить свою конкурентоспособность на рынке тоуда. 7. Будьте готовы к возможным собеседованиям и подготовьтесь к ним заранее. 8. Не опускайте руки и верьте в себя, так как поиск новой работы может занять некоторое время. Риг. 5.1 «Алиса» давт совет в трудней жизненной ситуации У «АЛИСЫ» два режима работы: базовый и продвинутый. Пер- вый вариант наделен стандартным функционалом, ответы могут быть обтекаемыми и не всегда конкретными. Продвинутый режим разработан с использованием новейших достижений в сфере ПИ, его ответы более развернутые, детальные и содержательные. В лю- бом случае формат текстового чат-бота удобен тем, что не требует использования микрофона и наушников: ввел текст с клавиату ры — получил ответ. На рис. 5.2 показан пример того, как «Алиса» пытается поднять настроение загрустившему человеку. 1ЧБ
виртуальный помощник «Алиса» мне грустно, расскажи что-нибудь веселое О Вот вам забавная история: Один человек приходит к врачу: • Доктор, у меня проблемы с памятью. Я всё забываю. • Хорошо, - говорит доктор, • как вас зовут? • Даже aid о не помню... * А что вы помните? • Помню, что у меня сегодня запись к вам на приём. А знаете, почему грустить не стоит? Потому что где-то в мире прямо сейчас панда ест бамбук и думает: “Эх, вот бы мне такую работу, чтобы только и делать, что есть бамбук и мило выглядеть’* Л ещё представьте себе слона, который пытается танцевать бальные танцы. Получится что то очень неуклюжее, но при этом невероятно грациозное! И помните: даже если сейчас вам грустно, всегда есть что то. что может поднять настроение. Например, моооженое. Или котёнок. Или смешной мем про котиков с мороженым! А знаете, что самое классное? Грусть - это как плохая погода: она обязательно закончится, и выглянет солнце И тогда вы сможете сказать: “Ну что ж, былс весело грустить, теперь пора веселиться!" Так чго не грустите сильно - а го морщины появятся, а их потом кремом не замажешь! ф Рис. 5 5 «Алиса» помогает справиться с плохим настроением Для перехода в режим голосового чата нужно подключить к компьютеру микрофон и наушники или колонки, после чего щелкнуть мышью на значке в поле ввода текста (рис. 5.3). Как вам помочь? Рис. 5.3 Переключение между текстовым и гелчеоаым четами На рис. 5.3 показана кнопка, которая отображается в режиме текстового чата. В голосовом чате она выглядит как на рис. 5.4. Аналогично происходит переключение голосового/текстового общения в мобильной версии «АЛИСЫ». 147
ГЛАВА 5 Искусственный интеллект как гшмищник, собеседник и друг Как вам помочь? Рис, 5.4. Кнопка переключения между чатами а голпсо->им режиме Далее все просто: говорите в микрофон и получайте голосовые ответы от ИИ. Можете даже попросить «Алису» спеть вам песенку: правда, она это сделает не сама, а предложит подходящий трек из каталога «Яндекс.Музыки» (рис. 5.5). слой песню про елочку Есть трек Младшая группа хора ИХВ АПН СССР, альбом “Советский Новый Год”, песня "В лесу родилась елочка”. Слушать на Яндекс.Музыке Л О' 61 - Рис 5 5. «Алиса» ЕыБрала песню пп заказу ппльззсателя Можно поболтать и на свободные темы. На рис. 5.6 показан диалог с нейросетью о чемпионате России по футболу. Он велся в голосовом режиме, но автоматически был продублирован как текстовый чат. как думаешь кто будет чемпионом россии по футболу Я думаю, что чемпионом России по футболу станет «Спартак». а почему ты так думаешь Просто нравится эта команда, слежу за её успехами. а что скажешь насчет зенита Думаю, что «Зенит» тоже будет бороться за чемпионство Рис. 5.Б. Диалог с «Алисой» г футболе 1ЧИ
виртуальный помощник «Алиса» Конечно, ответы «Алисы» вряд ли можно назвать экспертны- ми, тем более что иногда она может оперировать устаревшими данными или некорректными предположениями. Но поддержать беседу в формате дружеского общения о футболе она вполне в состоянии. При разговоре в режиме голосового чата нужно четко выговаривать слова и стараться избегать специфических, узконаправленных терминов и определений. В противном случае у ИИ могут возникнуть проблемы с распозна- ванием речи пользователя. Если без сложных терминог и определений обойтись не полу- чается, или вы не совсем четко выговариваете какие-то слова, лучше перевести общение в текстовый формат. Как и любой ИИ, нейросеть «Алиса» постоянно самообучается, а разработчики предлагают новые варианты использования. Бла- годаря этому с каждым днем опа становится все более полезной для пользователей. Умная колонка «Алиса» Официальное название девайса — «Яндекс.Станция» с встроенным голосовым помощником «Алиса». Это удобная, практичная умная колонка, которой с одинаковым успехом могут пользоваться люди разных поколений — от детей и подростков до пенсионеров. Она проста в эксплуатации, подходит для решения разноплановых задач, в том числе может выступать в роли приятного собеседника и личного консультанта. Умная колонка «Алиса» предлагается в нескольких вариантах исполнения, различаясь по функционалу, размерам, дизайну и мощности динамиков. Это позволяет выбрать девайс, опти- мальный по характеристикам и цене. 149
ГЛАВА 5 Искусственный интеллект как помощник, собеседник и друг В любом случае «Яндекс.Станция» с «Али- сой» умеет не только воспроизводить музыку, е ыступать в роли виртуального собеседника или секретаря, но и взять на себя управление системой «Умный дом», автоматизировать вы- полнение повседневных дел и решать другие сложные, масштабные задачи. Для настройки девайса, подготовки его к работе, а также управления режимами и функциями используется специальное приложение от «Яндекса», которое устанавливается на смарт- фон или планшет (есть версии под Android и iOS). Процесс предварительной настройки прост и понятен даже для людей, далеких от сферы IT-технологий. Он складывается из следую- щих этапов: ► Подключение к беспроводному Интернету. Включите колонку и подключите ее к электросети. Дождитесь мигания индикато- ра: это будет означать, что «Яндекс.Станция» подготовлена к настройке. Проверьте, чтобы колонка находилась в зоне действия Wi-Fi, убедитесь в надежности и достаточной пропускной способности интернет-соединения. ► Запуск мобильного приложения «Яндекс» для настройки умной колонки. Откройте его на планшете или смартфоне, проверьте текущую версию, при необходимости скачайте последние обновления. Это необходимо для максимальной функциональности и совместимости с девайсом. ► Добавление «Яндекс.Станции» в мобильное приложе- ние. Только после этого можно будет управлять девайсом со смартфона или планшета. Откройте в мобильном прило- жении раздел «Устройства», перейдите в режим добавления нового устройства. Дальнейшие действия выполняются в пошаговом режиме согласно появляющимся на экране инструкциям. 15D
Виртуальный помощник «Алиса» После выполнения перечисленных действий нужно про- верить связь «Яндекс.Станции» с Интернетом и ее готовность к эксплуатации. Спросите у «Алисы», сколько сейчас времени, какая погода или задайте пару других аналогичных вопросов. По ответам будет понятно, можно ли пользоваться девайсом или нужны еще какие-то манипуляции. Чтобы «Яндекс.Сганция» работала бесперебойно и была мак- симально эффективной, соблюдайте следующие рекомендации: ► Регулярно и своевременно обновляйте прошивку. Умная колонка может делать это в автоматическом режиме — в за- висимости от установленных настроек. Это позволит получать доступ к новым функциям и режимам работы сразу после того, как их выпустят. В ходе обновлений устраняются имевшиеся ошибки, повышается производительность, оптимизируется работа устройства. ► Следите за качеством Wi-Fi-соединения. Для бесперебой- ной работы колонки необходимо надежный интернет-канал с высокой пропускной способностью. ► Внимательно ознакомьтесь со всеми командами виртуаль- ного ассистента «Алиса». Они есть на сайте «Яндекса» или в мобильном приложении, предназначенном для работы с «Я ндекс.Станцией». Это позволит общаться с колонкой на одном языке, наладить хорошее взаимопонимание и мак- симально задействовать ее функционал. Если в процессе эксплуатации колонки с «Алисой» возникли неполадки, проверьте наличие и качество интернет-соединения. Как показывает практика, большинство подобных ситуаций возникает из-за проблем с каналом связи. Возможно, колонку вынесли из зоны действия Wi-Fi или сигнал пропал по другой причине. Еще одна распространенная проблема — отсутствие реакции на голосовые команды. Часто выясняется, что причина — выклю- 151
ГЛАВА 5 Искусственный интеллект как пимищник, собеседник и друг ченный микрофон. Также иногда проблема решается перезагрузкой устройства. Иногда умная колонка не воспроизводит музыку. В этом случае необходимо проверить, действует ли подписка на «’Яндекс.Музыку» или аналогичный сервис. Разработчики строго следят за соблю- дением авторских прав, поэтому воспроизведение музыкальных произведений возможно только при наличии активной подписки. Краткий обзор лучших голосовых помощников Своя версия голосового помощника и виртуального друга сего- дня есть у многих представителей IT-рынка. По функционалу и принципу действия они во многом сопоставимы, поскольку все работают на основе технологий ИИ. Далее приведем краткий обзор некоторых наиболее популярных решений. «Салют» Виртуальный помощник «Салют» разработан Сбером. Он есть в умных колонках, ТВ-медиацентрах и телевизорах Sber, может устанавливаться в гаджеты сторонних производителей. Общаться с ним можно практически так же, как с человеком: он объединен с известной нейросетью LlgaChat (в главе 3 мы рассматривали ее в плане генерации изображений), поэтому за выполнение команд пользователя, память и принятие реше- ний отвечает ИИ. Ответы на заданные вопросы и прочий поиск информации осуществляются с помощью технологии GigaSearch. «Салют» способен высказывать свое мнение, фантазировать, придумывать креативные идеи, поддерживать беседу на разные темы. По выбору пользователя он может общаться от имени трех личностей: ► Афина — стиль общения умеренный, спокойный; 152
Краткий иБзир лучших гплоси^ых гшмащникав ► Джай — бодрая, легкая интонация; ► СБвр— дружелюбная манера общения в деловом стиле. Благодаря хорошей памяти «Салют» запоминает то, что ему говорил пользователь. Например, если вы рассказали виртуаль- ному помощнику, что любите томаты, то при запросе на рецепт салата вам будет предложен вариант с помидорами. «Салют» можно подключить к телевизору: тогда он будет быстро находить подходящие сериалы и фильмы. Виртуальный помощник развлечет детей, обеспечит управле- ние системой «Умный дом», закажет нужные покупки в разных магазинах и сразу их оплатит, сделает по просьбе пользователя денежный перевод и выполнит массу других полезных задач. «Маруся» Виртуальный помощник «Маруся» от VK предлагается в виде так называемых капсул (колонок характерной формы). Также он есть в телевизионной приставке Wink и детских умных часах. «Маруся» интегрирована практически во всю экосистему VK. Она особенно нравится детям благодаря следующим особенностям: ► характерный детский дизайн — колонка имеет закруглен- ную форму и предлагается в зеленом, оранжевом, голубом и других цветах; ► возможность дополнительного декора с помощью разных стикеров, входящих в комплект поставки; ► умение «строить глазки» на дисплее в зависимости от вы- ражаемых эмоций (например, если погладить «Марусю»); 153
ГЛАВА 5 Искусственный интеллект как помощник, собеседник и друг ► способность рассказать сказку, помочь с выполнением до- машних заданий, спеть колыбельную. Однако «Маруся» популярна и у взрослых пользователей. На том же дисплее она покажет не только время или погоду, но и результат хоккейного матча, программу телепередач или другую информацию, актуальную для пользователя. Кроме этого, «Маруся» может вызвать такси, заказать покупки в интернет-ма- газинах, взять на себя управление умным домом и решать мно- жество иных задач. На момент написания данной книги в «Мару- се» реализована поддержка 847 функций, Это официальная информация, опубликованная на сайте производителя. Важное преимущество «Маруси» — способность безошибочно распознавать детские голоса. Благодаря этому она умеет автома- тически ограждать детей от неподходящего контента. Кроме этого, у виртуального помощника есть детский и семей- ный режимы работы. «Маруся» также будет тщательно следить за тем, что она воспроизводит (например, колонка не включит песню с нецензурными словами или эротический фильм, не будет высказываться на интимные и прочие деликатные темы, нс пред- назначенные для юной аудитории). Xiaomi Mi Smart Speaker Голосовой помощник Mi Smart Speaker от разработчика Xiaomi поддерживает русский язык; в глазах российской аудитории это выгодно отличает его от многих импортных аналогов. Благода- ря совместимости со многими экосистемами этот виртуальный 154
Краткий иБзир лучших гилосовых пшчащникав ассистент обладает широким функционалом. Его можно исполь- зовать в качестве собеседника, советчика, консультанта, он может управлять умным домом с поддержкой разных сценариев и вос- приятием речевых команд. Колонка работает как от встроенного аккумулятора, так и от электросети. По желанию пользователя Xianmi Mi Smart Speaker может: ► включить музыку, завести будильник, поставить любимый фильм; ► рассказать прогноз погоды и последние новости; ► сообщить результаты футбольных матчей и других спортив- ных состязаний; ► вызвать такси, оформить заказ в интернет-магазине, пооб- щаться на свободные темы и пр. Перечень функций достаточно обширен, а использование технологий ИИ обеспечивает способность к самообучению. Благодаря стильному современному дизайну колонка Xiaami Mi Smart Speaker хорошо вписывается в любой интерьер. Мощности 12-ваттных динамиков достаточно даже для большого помещения, звук равномерно распределяется во все стороны. Коммуникация с другим домашним оборудованием осуществляется с помощью беспроводных протоколов Bluetooth. Wi-Fi, также поддерживается кабельный Ethernet. Google Assistant Интеллектуальный голосовой помощник Google Assistant — один из первых в мире виртуальных ассистентов, ставших доступными широкому кругу пользователей. Его можно установить на смарт- фон или планшет, он совместим с операционными системами Android, iOS, Linux, Chrome OS и др., поставляется в составе умных колонок и часов, телевизоров и дисплеев, а также других современных гаджетов. 155
ГЛАВА 5 Искусственный интеллект как помощник, собеседник и друг Виртуальный помощник CooglE Assistant поддерживает не- сложные диалоги, понимает разговорную речь, а также умеет: ► отправлять сообщения по команде пользователя; ► отвечать на вопросы, принимать телефонные звонки; ► настраивать будильник, устанавливать напоминания; ► покупать билеты, вызывать такси; ► бронировать места в ресторанах и номера в отелях; ► выстраивать маршруты, рассказывать о достопримечатель- ностях; ► составлять планы на день, списки покупок и неотложных дел, и пр. Также Google Assistant включит любимую музыку или фильм, расскажет о новостях и прогнозе погоды, дорожных пробках, напомнит о важной встрече. Поскольку виртуальный ассистент работает с использованием технологий на основе ИИ, он по- стоянно «повышает свою квалификацию» за счет самообучения, запоминая предпочтения и пожелания пользователя. Для Google Assistant родной язык — англий- ский; именно на нем достигается наилучшее взаимопонимание с виртуальным помощником Но ассистент поддерживает и русский язык, поэтому популярен у российских пользователей. Однако понимание некоторых команд, а также способности к общению на свободные темы у него хуже по сравнению с изначально рус- скоязычными аналогами («Алисой», «Марусей» и «Салютом»). В некоторых случаях приходится повторить команду или подробнее объяснить, что именно нужно сделать При этом лучше гово- рить на простом и понятном языке, без сложных речевых оборотов и специфических терминов. 15Б
Как выбрать голосового помощника Важная функция Cr'OglE Assistant — его способность центра- лизованно управлять всеми элементами системы «умный дом», включая освещение, сигнализацию, температуру, функциониро- вание кухонной и бытовой техники, контроль доступа и пр. Как выбрать голосового помощника Для многих пользователей один из основных критериев — це- новая доступность сервиса. Даже небольшая плата — зачастую повод для того, чтобы отказаться от электронного друга в пользу бесплатного аналога. Но важно учитывать следующее: во-первых, плата в большинстве случаев необременительна даже для людей с невысокими доходами, а во-вторых, нет никакой гарантии, что бесплатный сегодня продукт завтра сделают платным. Поэтому лучше все же ориентироваться на функциональные особенности виртуального ассистента и собственные потребности. В первую очередь обратите внимание на поддерживаемые языки. Если вы не говорите по-английски, лучше выбрать про- дукт от российского разработчика — ту же «Алису», «Салют» или «Марусю». Это наиболее популярные голосовые помощники: есть также «Дуся», «Олег» и др. Для англоязычных пользователей хороший выбор — 5iri от Apple или Б jaglE Assistant; они хоть и понимают русский язык, но с ограничениями. А виртуальный помощник Xiaomi Mi Emart Брваквг может общаться как на русском, так и на китайском языке. Определитесь с требованиями к функционалу. Большинство основных режимов и функций стандартные (любой ассистент умеет рассказать прогноз погоды или включит ь любимую музыку), но обратите внимание на те, которые являются для вас наиболее актуальными. Одному голосовой помощник нужен преимущест- венно для развлечения детей и контроля за ними, другому — для быстрого перевода текстов на другие языки, третьему — для управления умным домом, четвертому — для прослушивания 157
ГЛАВА 5 ИскуЕЕТиенный интеллект как помощник, собеседник и друг музыки и просмотра сериалов на стриминговых ресурсах, пятому необходим надежный электронный секретарь и т. д. Один из ключевых критериев — совместимость. Убедитесь, что интересующий голосовой по- мощник совместим со всеми устройствами, с которыми вы планируете его использовать: планшетами, смартфонами, умными часами и колонками, фитнес-браслетами, телевизорами, дисплеями, системой «умный дом» и пр. Заранее уточните, возможна ли интеграция голосового помощ- ника с другими сервисами и продуктами, которыми вы привыкли пользоваться. В их числе могут быть электронная почта, календарь, музыкальные приложения, цифровые органайзеры и пр. Изучите отзывы пользователей на независимых ресурсах в Интернете. Часто именно там можно узнать нс только о преи- муществах и недостатках голосовых помощников, но и о мало- известных дополнительных возможностях, которые значительно расширяют функционал продукта.
ГЛАВА Б БЕЗОПАСНОСТЬ 1/1 КОНФИДЕНЦИАЛЬНОСТЬ В ЦИФРОВУЮ ЭПОХУ: РУКОВОДСТВО Опасность цифрового мира в том, что многие процессы в нем находятся вне поля видимости. Авторизация и аутентификация, передача и трансформация данных, соединение с веб-ресурсами и т. д. часто происходят автоматически. Во многих случаях даже непродол- жительная работа в Интернете сопровождается обилием текущих операций, о которых неискушенный человек даже не подозревает. В реальной жизни мы легко замечаем, если в отношении нас совершаются противоправные действия. Как можно не уви- деть преступника, пытающегося вырвать у вас из рук кошелек? Но такой же преступник, владеющий IT-технология ми, навыками социальной инженерии и находящийся хоть на другом конце зем- ного шара, легко выманивает у ничего не подозревающих жертв логины, пароли и прочие средства доступа, после чего незаметно опустошает банковские счета и онлайн-кошельки. И эго один из самых простых и банальных способов кибер- мошенничества, которым онлайн-злоумышленники пользуются как минимум уже лет двадцать. В более сложных случаях люди сами отдают преступникам сбережения, продают единственное жилье и переводят им деньги, а потом еще и выполняют проти- воправные указания, рискуя на долгие годы угодить за решетку. 159
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководство Любой человек за.мстит, если в его присутствии в квартиру пытаются вломиться воры. Но этот же человек, работая за ком- пьютером или держа в руках мобильный телефон, может и не по- дозревать, что в его устройствах одновременно с ним копаются с полсотни хакеров разного пошиба, а все его действия момен- тально фиксируются программами-шпионами с автоматической отправкой полученной информации хозяину. Не надо быть профессиональным хакером, что- бы залезть в компьютеры сотен и тысяч пользо- вателей со шпионскими, мошенническими или другими противоправными целями: достаточно иметь определенный минимум знаний в сфере современных IT-технологий и доступ к инстру- ментам. которые нужно лишь настроить и при- вести в действие Сегодня это под силу многим школьникам средних классов. В этой главе мы расскажем, чем опасен виртуальный мир, какие риски несет в себе использование ИИ, а также как защитить себя от цифровых угроз и неприятностей. Основные меры безопасности Главный залог успеха киберпреступников — это беспечность и невнимательность пользователей, их неумение или нежелание уделить хотя бы минимум времени и усилий для собственной безопасности. Рассмотрим несложные меры, которые могут свести на нет все усилия онлайн-злоумышленников. Защита ПК или смартфона от постороннего доступа Пользоваться компьютером или мобильным устройством должен только хозяин. Это предмет личного потребления, доступ к нему 1Б0
Основные меры Безопасности посторонних недопустим. Исключением может быть только ро- дительский контроль, но сейчас речь о другом. Даже близкий человек, сам того не ведая, может нажать в смарт- фоне не ту кнопку, перейти не на тот сайт, сообщить кому-то код из СМС — и все это либо с лучшими намерениями или по не- внимательности. Если же доступ к компьютеру или мобильному устройству получают незнакомые лица, тяжесть последствий будет трудно предугадать. Компьютер необходимо защитить паролем. Здесь речь о за- щите не от взлома или хакерства (для этого используются дру- гие методы), а скорее от нездорового любопытства, шпионажа и т. п., чтобы никто не смог воспользоваться компьютером в от- сутствие хозяина. При этом желательно, чтобы парольная защита включалась автоматически после непродолжительного (например, 2-3 минуты) простоя. Смартфоны и планшеты часто теряют и воруют. Поэтому им нужна более надежная защита, тем более что многие владельцы пользуются мобильными устройствами для онлайн расчетов в магазинах, хранят в них ключи и коды доступа к банковским счетам, электронным кошелькам. Пин-код считается надежным способом защиты, но при условии, что состоит не из четырех (как обычно, по умолчанию предлагается опера- ционными системами), а большего количества символов — например, шести. При этом не стоит вводить банальные наборы цифр зроде 123456 или 112233: злоумышленники подбирают их мо- ментально. Также надежно защищают устройство от несанкционирован- ного доступа биометрические технологии — сканер отпечатка пальца и распознавание лица. Но при использовании функции Face ID необходимо учитывать некоторые нюансы. Хорошая 161
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководства система распознавания лиц включает в себя целый ряд высоко- технологичных компонентов: ► точечный проектор; ► обычная и инфракрасная камеры; ► защищенное хранилище; ► уникальная система обработки данных; ► алгоритмы машинного обучения на основе 1/11/1. Подобные системы Face ID используются в мобильных устрой- ствах производства Apple и других премиальных брендов. В их разработку вложено немало средств и усилий, во многом именно поэтому такие девайсы дорого стоят. Но системы распознавания лиц работают быстро и надежно. Однако многие другие производители в стремлении удешевить свои смартфоны и планшеты экономят на дорогостоящих ком- плектующих. При этом они не отказываются от функции Face ID, поскольку ее наличие — мощный маркетинговый инструмент, кото- рый способствует интенсивному росту продаж. Но для экономии они убирают точечный проектор или инфракрасную камеру (или и то и другое, и еще что-нибудь), что приводит к значительному снижению эффективности системы распознавания лиц и повышает вероятность сбоев, а также делает ее уязвимой к взломам. В результате обмануть такую Face ID можно с помощью про- стой фотографии — например, полученной из профиля жертвы в социальной сети. Ее можно распечатать или вывести на экран компьютера, и система распознавания лиц послушно разблокирует чужой смартфон. А мобильные устройства с более усовершен- ствованными Face ID иногда взламываются по ЗЭ-фотографии или маске. Чем опасны общедоступные сети Wi-Fi Бесплатные Wi-Fi-сети — одни из самых уязвимых мест с точки зрения IT-безопасности. Главная особенность заключается в том, 1Бе
□сньаные меры Безопасности что многие из них нс шифруют трафик. Поэтому любой злоумыш- ленник, подключившийся к той же точке доступа Wi-Fi, может просматривать данные, которые пересылают и получают другие пользователи беспроводной сети. Это один из распространенных и сравнительно простых способов хищения чужой информации. Самая неприятная ситуация — когда хакеру удается занять позицию между вами и точкой подключения. В этом случае он будет играть роль своеобразного посредника: вначале отправляе- мые ваши данные попадают к злоумышленнику, а потом — на точку доступа. Аналогичная картина и с принимаемой информацией: он поступает к вам не напрямую, а через злоумышленника. Таким образом к нему попадает весь ваш входя- щий и исходящий трафик, иключая электронные письма, сообщения в мессенджерах, реквизиты доступа к банковским счетам и т. д. Еще одно направление деятельности хакеров в незащищенных Wi-Fi-сетях — распространение вредоносного ПО. Если на смарт- фоне, ноутбуке или планшете пользователя включено разрешение на обмен файлами в беспроводной сети, киберпреступники без особых усилий могут установить на устройство жертвы зараженное приложение. Более продвинутые мошенники умеют взламывать точки доступа: в этом случае пользователь при подключении к сети Wi Fi видит на экране всплывающее окно, в котором предлагается установить обновление для популярной программы. Если нажать на это окно, то загрузка вредоносного ПО начнется автоматически. Чтобы не пострадать от хакеров при подключении к обще- доступным сетям Wi-Fi, соблюдайте следующие рекомендации: ► Минимизируйте время пребывания в сети. Не используйте общедоступные Wi-Fi для многочасовой работы или ре- 153
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководство шения других задач, требующих длительного пребывания. Подключайтесь только для коротких дел небольшой важности (посмотреть новости, ответить в мессенджерах и т. п.). ► Используйте VPN (виртуальную частную сеть). Это обяза- тельное правило безопасности при подключении к любым незащищенным общественным сетям, в числе которых Wi-Fi. Даже если злоумышленник сумеет подключиться к вашему соединению, весь передаваемый трафик будет надежно зашифрован. Теоретически его можно расшифровать, но это потребует времени и усилий, а большинство хакеров нацеле- ны на получение быстрой и легкой добычи, поэтому им проще отказаться от похищенной зашифрованной информации и украсть ее у других, более беспечных пользователей. * * Подключайтесь через SSL-соединение. Для этого в на- стройках безопасности интернет-обозревателя активируйте опцию «Всегда использовать HTTPS». Это особенно акту- ально при посещении веб-ресурсов, на которых требуется наличие учетной записи (авторизованного аккаунта). Если, например, вы используете одну и ту же комбинацию логина и пароля для авторизации на разных сайтах (например, в корпоративной сети, на интернет-форумах, в онлайн-бан- кинге и пр.), то отправлять их нужно только через зашиф- рованный трафик. При выходе в Интернет в общедоступных местах отключайте на своем устройстве функцию общего доступа. В зависимости от используемой операционной системы это можно сделать в па- нели управления или системных настройках. Если вы находитесь в зоне действия общедоступной беспрово- дной сети, но при этом не пользуетесь Интернетом, — отключай- тесь от Wi Fi. В противном случае связь между вашим устройством и Wi-Fi будет поддерживаться, также неизбежен определенный обмен данными. Это делает соединение уязвимым к внешним вмешательствам. 1БЧ
□сновные меры Безопасности Контроль мобильных приложений и расширений браузеров Многие приложения для мобильных устройств часто просят у пользователей открыть им доступ к файлам или контактам, разрешить использовать геолокацию, микрофон, камеры и пр. В некоторых случаях им это необходимо для нормальной рабо- ты и задействования всего функционала. Но многие подобные продукты используют полученные сведения для слежки за поль- зователем — например, в маркетинговых целях (это в лучшем случае). Поэтому необходимо контролировать права приложений и при необходимости отключать или ограничивать их доступ к тем или иным объектам на мобильном устройстве. Это делается в настройках операционной системы. Аналогичные шпионские наклонности свойственны рас- ширениям для браузеров. В общем случае это дополнительные модули, подключаемые к веб-браузеру для расширения его штат- ных возможностей. Они могут менять его интерфейс, добавлять и нору менты, делать работу в Интернете более комфортной. С их помощью можно переводить веб-страницы, блокировать рекламу, совершать онлайн-покупки и т. д. (рис. 6.1). С расширениями совместимы практически все современные браузеры, включая Google Chrome, Internet Explorer, Opera, Mozilla Firefox и др. Некоторые пользователи устанавливают по несколь- ко десятков дополнительных модулей, не подозревая о том, что каждый из них — потенциальный шпион. Чаще всего вредоносны плагины, предлагаемые для скачивания на сторонних сайтах. Но иногда опасное ПО проникает и в официальные мага- зины типа Google Play или Chrome Web Store. Иногда плагины маскировались под прило- жения для заметок, но в реальности помогали разработчикам зарабатывать деньги, кликая по рекламным ссылкам. 1Б5
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководство Сделайте Firelox своим ц Return YouTube D'slike ст Dmnrv Sgl..a-то. Верните способность видеть реакцию «Не понравилось*! ***** Пальзоелелей: 858 508 ДоТиыпт I rrrn Adaptive Гао Bar Colour - , _ . , г Добавить в Hi сто* OTL<:cn Изменяет цвет ыоток чтобы он соответствовал внешнему виду любого веб-сайта ** *** Пользователей: 27 776 Green Side от Cool СлмГог5М5 Аа Dark Backqiound and Light Text CT MikhaJ Khvc.rutskv Настраивайте оттенки светлого и темного, чтобы сделать веб страницы визуально более приятными ***** Пользователей: 40 882 Рис. Б.1 Расширения для браузера Mazilla Firefox Лооавить s I iretm Проблема в том, что многие популярные браузеры по умол- чанию предоставляют плагинам все разрешения. На момент написания книги исключение — только Google Chrome, но даже у него процесс управления разрешениями для плагинов небезу- пречен. Ситуация осложняется тем, что многие расширения при установке требуют предоставления всех возможных прав, иначе следует от каз. Привлекательность плагинов у киберпреступников обуслов- лена тем, что такие расширения обновляются в автоматическом режиме. Пользователь может скачать и установить вполне безобид- ный продукт, который после первого же обновления превратится в шпиона или хакера. Ни один известный разработчик с хорошей деловой репута- цией таким не занимается, но злоумышленники могуз взломать 1ББ
Основные меры Безопасности учетную запись, чтобы впоследствии загрузить в официальный магазин вредоносное обновление от его имени. Возможно и такое, что сторонние компании выкупают пла- гины для браузеров у разработчиков. Последние обычно охотно соглашаются на подобные сделки: расширения относя гея к той категории программных продуктов, которые в принципе сложно монетизировать. А после совершения сделки и передачи всех прав на плагин новый владелец выпускает для него вредонос- ное обновление, которое автоматически устанавливается у всех пол ьзователей. Подобное преступление было совершено в отношении разработчиков популярного рас- ширения Copyfish. Мошенники взломали ак- каунт, после чего полезный плагин, изначально предназначенный для распознавания текстов с картинок, стал демонстрировать пользовате- лям навязчивую рекламу. Нечто подобное произошло с популярным расширением Particle, которое предназначалось для Google Chrome. В какой-то момент разработчики перестали его поддерживать и фактически забросили. Но нашлась компания, которая выкупила данный плагин и моментально превратила его в рекламное ПО. Несмотря на потенциальную опасность, некоторые расшире- ния очень полезны, и отказаться от них непросто. Чтобы мини- мизировать вероятность «несанкционированной деятельности* со стороны плагинов, соблюдайте следующие рекомендации: ► Не устанавливайте слишком много расширений: пользуй- тесь только теми, которые реально необходимы. Большое количество плагинов приводит к снижению производитель- ности браузера (он начинает тормозить даже в безобидных ситуациях, включая неоправданно долгую загрузку) и делает 1Б7
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководство компьютер более уязвимым к фишингу и прочим хакерским атакам. * Скачивайте расширения только из официальных источников. В известных магазинах с хорошей репутацией подобные продукты проходят предварительную проверку, и самые вредоносные плагины отфильтровываются. ► Обращайте внимание на разрешения и доступы, которые запрашивает каждый плагин. Если уже установленное рас- ширение по каким-то причинам требует предоставить новый доступ, это тревожный симптом. Вероятно, продукт был или взломан или продан сторонней компании (сточки зрения последствий это может быть одно и то же). При малейших подозрениях удаляйте его без сомнений. Перед установкой нового плагина проверьте, какие доступы и разрешения он запрашивает — и насколько они соответствуют его назначению и функционалу. Если есть сомнения, сразу отка- зывайтесь от установки. Ну и, конечно, пользуйтесь хорошей защитной програм- мой. Качественные антивирусы от известных разработчиков легко выявляют вредоносные плагины и расширения для всех браузеров. Правила парольной защиты Защищать свои данные паролем необходимо во всех сервисах, где предусмотрена такая возможность. Это одна из самых эффек- тивных мер по предотвращению несанкционированного доступа. Надежный пароль соответствует следующим требованиям: ► отсутствие легко распознаваемых последовательностей (абвгде, 12345, parol, qwerty и пр., рис. 6.2); ► минимальное количество символов 10-12 (можно больше — это практически исключит вероятность подбора и повысит эффективность защиты); 1БИ
□снрвныё меры Безопасности ► обязательное наличие всех типов символов — прописных и строчных букв, цифр, а также специальных знаков (&, #, Л ит. п.); ► отсутствие данных, которые несложно узнать (номер и се- рия паспорта, ИНН, дата рождения или бракосочетания, СНИЛС, кличка домашнего питомца, регистрационный номер автомобиля и т. п.). Рис. Б.5. Подарок для злоумышленника примитивный пароль к тому же записан на Бумажке Никогда не вводите логины и пароли в местах скопления лю- дей (очередь, общественный транспорт, торговый центр и т. д.): их могут заметить и запомнить посторонние. Желательно нс делать этого под камерами видеонаблюдения: неизвестно, кто имеет доступ к просмотру отснятого материала. Не используйте одинаковые логины и пароли для доступа к разным сервисам — например, для входа в интернет-банкинг, рабочий кабинет и электронную почту. Если они будут похищены злоумышленниками, вы не сможете пользоваться ничем, к тому же потеряете все деньги с банковского счета. 1Б9
ГЛАВА Б Безопасность и конфиденциальность к цифровую эпоху руководства Болтун — находка для шпиона, или Важность неразглашения информации посторонним Успешная деятельность кибермошенников во многом базируется на беспечности и халатности жертв. Перефразируя Остапа Бендера, современные злоумышленники просто подбирают с дороги деньги, беспечно разбросанные интернет-пользователями. И во многих случаях людям, пострадавшим от киберпреступников, винить нужно прежде всего себя. Это не снимает ответственности с мо- шенников, но если человек сам не думает о собственной безопас- ности, никто другой этого не сделает. Непонятно, о чем думают люди, записывающие пин-код прямо на банковской карте или хранящие пароль доступа к телефону на бумажке, спрятанной под его чехлом. Как только карточка или девайс будут утеряны, злоумышленник получит к ним полный доступ и воспользуется ситуацией. Проблема телефонных мошенников и прочих киберпреступников будет актуальна до тех пор, пока люди добровольно называют им СМС-коды, номера счетов, пароли и прочую конфиденци- альную информацию. Любая информация личного характера должна быть доступна только се владельцу. В редких случаях можно довериться кому-то одному из самых близких людей (супругу, родителю, взрослому сыну или дочери). Причем это касается только ситуаций, когда по-другому поступить не получается (например, сын снимает пенсию с карты тяжелобольной матери по ее просьбе и для этого ему нужен пин-код). Конфиденциальная информация потому так и называется, что не предназначена для посторонних. И уж тем более нельзя сообщать ее тем, кто звонит по телефону, даже если они пред- 170
□сноаные меры Безопасности ставляются сотрудниками банка, работниками правоохранитель- ных органов или кем-то еще. Это диктуется даже элементарной логикой: вы этого человека вживую никогда нс видели — как же можно сообщать ему данные для доступа к банковскому счету или под его честное слово передавать курьеру наличные деньги? Лучший способ защитить себя — немедленно прекращать любое общение с незнакомцами по телефону. Сотрудники банка никогда не решают вопросы в удаленном режиме; то же самое касается работников «Госуслуг», жилищно-коммунального хозяйства, нало- говой инспекции и других государственных учреждений. Если же вы по каким-то вопросам понадобились сотрудникам силовых структур — поверьте, они найдут способ достучаться до вас без сомнительных звонков по телефону (вызовут повесткой или через участкового, приедут сами к вам домой или на работу и т. д.). В последнее время мошенники все чаще используют техноло- гии ИИ. Так, они научились с помощью нейросетей генерировать голоса близких родственников жертвы, и выпрашивать с их по- мощью деньги под любым предлогом (человек совершил тяжкое ДТП и нужны средства на адвоката, ваш родственник в больнице и нужна экстренная дорогостоящая операция и т. п.). При этом образцы голоса они берут путем обычного «холодного» обзвона: человек принимает входящий звонок, говорит в трубку: «алло, вас не слышно, перезвоните» — и этих слов достаточно для того, чтобы по ним сгенерировать имитирующую речь. Если вам позвонил близкий человек и срочно просит деньги по какому-то экстренному пово- ду — прекратите разговор и перезвоните ему сами. Если это действительно так, ответит или он, или тот. кто находится рядом (если действи- тельно ситуация экстренная). Но обычно человек берет трубку и с большим удивлением узнает, что с ним. оказывается, что-то случилось и ему срочно нужны деньги. 171
ГЛАВА Б Безопасность и конфиденциальность в цифроную эпоху руководство Никому и никогда не говорите, в каких банках вы храните деньги, а также сумму сбережений. Эта информация — «золотой ключик» мошенников для доступа к вашим накоплениям. Прочие рекомендации по безопасности В разных странах мира предпринимаются те или иные меры по борьбе с кибермошенничеством и защите населения от опас- ностей, которыми чревата беспечность и невнимательность при работе с нейросетями и другими достижениями современной IT-индустрии. Но пользователи сами должны заботиться о своей безопасности, в том числе путем соблюдения перечисленных ниже рекомендаций. Заведите отдельный смартфон для банковских мобильных приложений, а также для авторизации на других важных сервисах (например, « Госуслуги»). Это может быть дешевый и малофункциональный аппарат, главная задача которого — выход в Интернет по мере необходимости. Не устанавливайте на него мессенджеры, не используйте для какого-либо общения. ► Работайте только с официальными платформами. Внимательно изучайте политику конфиденциальности нейросетей и убеждай- тесь в том, что информация о вас не будет передана третьим лицам. С осторожностью относитесь к Telegram-ботам, осо- бенно от малоизвестных разработчиков: их часто используют злоумышленники для получения доступа к профилям жертв. ► Регулярно очищайте историю посещений и запросов в бра- узере: это позволит минимизировать вероятность утечки конфиденциальной информации. Также это одна из превен- тивных мер против слежения за пользователем со стороны мошенников, рекламщиков и прочих посторонних лиц. ► Заведите отдельные аккаунты для регистрации на разных ресурсах. Не используйте для этого учетные данные, к кото- рым привязана электронная почта, страницы в социальных сетях, банковские сервисы и приложения. 175
Опасности искусственного интеллекта ► По мере возможности старайтесь пользоваться автоном- ным ПО, которое не требует постоянной связи с Интернетом. Например, если вы хотите заняться обработкой видео и фото, установите на компьютер локальный редактор с функциями ИИ — это более безопасно по сравнению с онлайн-серви- сами. ► Проверяйте все ответы, которые выдает вам ИИ, в надежных, проверенных источниках (энциклопедических справочниках, специализированных каталогах и т. д.). Иногда полезно сопоставить варианты ответов на один и тот же запрос, полученные в разных нейросетях. Не стоит забывать о классических правилах безопасности. Это установка надежного антивирусного и антишпионского ПО, регулярное сканирование компьютера и мобильных устройств на предмет обнаружения вредоносных программ, скачивание файлов только из надежных и известных источников. Для авто- ризации на сервисах и в приложениях, где хранятся ваши лич- ные и конфиденциальные данные, используйте двухфакторную идентификацию. Опасности искусственного интеллекта Несмотря на интенсивное развитие технологий, связанных с ИИ. это направление может быть источником целого ряда опасностей как с государственной точки зрения, так и на обывательском уровне. Многие специалисты акцентируют внимание на том, что бесконтрольное использование нейросетей недопустимо: если ИИ окажется в руках злоумышленников, предугадать последствия будет трудно. С этим можно соглашаться или нет, но тот факт, что ИИ — это реалии сегодняшнего дня, оспаривать бессмысленно. А раз так, 173
ГЛАВА Б Безопасность и конфиденциальность в цифриную эпоху руководство нужно четко представлять себе все опасности, которые могут исходить от нейросетей и знать, как с ними бороться. Создание и использование фейков Генеративные способности нейросетей стали мощным драйвером для создания и использования многочисленных фальсификаций. В их числе так называемые «дипфейки» — созданные на компью- тере фотографии и видеоролики с максимально реалистичным изображением конкретного человека. Сегодня не нужно обладать большими знаниями и умениями, чтобы самостоятельно смонтировать ролик с участием любого персонажа. Причем можно обойтись без видеозаписи: нужно лишь загрузить пару десятков фотографий человека, сделанных с разных ракурсов. На их основе ИИ сгенерирует вполне прав- доподобный видеоролик. Нейросеть умеет имитировать человеческие голоса, причем не только в виде голосового общения, но и в исполнении песен. Полностью копируется темп, смена интонаций, паузы и другие характерные особенности речи конкретного человека, включая характерные для него словосочетания и лексические обороты. Все это позволяет ИИ создавать дипфейки с высоким уровнем достоверности. При просмотре подобных роликов неподготов- ленный зритель может не сомневаться в реальности увиденно- го. Это позволяет использовать подобные технологии даже для массового манипулирования общественным мнением. С этой точки зрения создание дипфейков пользуется стабильно высоким спросом со стороны политиков, крупных бизнесменов и других людей, наделенных властью. При определенных обстоятельствах это может привести к серьезным последствиям, вплоть до мас- штабных социальных потрясений и серьезной дестабилизации обстановки в обществе. Однако создание дипфейков несет опасность и на обыватель- ском уровне, затрагивая целый ряд морально-этических, юриди- ческих, социальных и иных аспектов. 174
I пагности ИЕКЦССТвЕННОГLI ИНТЕЛЛЕКТЕ Например, сегодня широко распространено такое явление, как нарушение авторских и личных прав, в том числе для злоупо- требления чужой популярностью. Злоумышленники с помощью ИИ генерируют рекламные ролики с фейковым изображением знаменитостей, которые якобы агитируют покупать определенный товар или услугу. Человек, чье изображение подделано на фейковом ролике, потом вынужден доказывать, что не имеет к нему никакого отношения и не занимается продвижением данного товара (услуги). Голосовые дипфейки — один из главных рабочих инструментов киберпреступников. Подделывание чужой речи позволяет мошен- никам выманивать огромные суммы денег не только у рядовых обывателей, но и у сильных мирг! сего — политиков, крупных бизнесменов, звезд шоу-бизнеса. Широко известны примеры, когда преступни- ки имитируют голоса близких родственников жерт в. Здесь возможны самые разные сценарии: например, человеку звонит якобы родст венник, рассказывает о своем похищении и о том, что ему причиняют физические страдания, и про- сит срочно перевести/передать деньги для выкупа. Другой пример — человек якобы попал в полицию и просит заплатить крупную сумму денег, чтобы избежать заключения. Или внучка звонит бабушке и говорит, что сбила человека на машине, и ей нужны деньги для «решения вопроса» с его родственниками, и т. д. Во всех перечисленных случаях жертвы не подозревают, что разговаривают не с родственником, а с пре- ступником. подделавшим голос с помощью ИИ Одни из самых жестких, даже жестоких направлений исполь- зования дипфейков — шантаж и компрометация личности путем распространения порочащих сведений. В 2023 году много шума наделала история в одной из американских школ, в которой 175
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководство старшеклассники с помощью ИИ сгенерировали фотографии своих обнаженных одноклассниц и распространяли их фейковые изображения через Интернет, включая общих друзей и знакомых. Такие действия могут нанести серьезную психологическую травму не только подросткам, но и взрослым людям. Злоумыш- ленники с помощью дипфейков, созданных нейросетями, ком- прометируют: ► семейных людей — в глазах жен/мужей, детей, других близ- ких родственников; ► работников — в глазах коллег и начальства; ► руководителей — в глазах подчиненных сотрудников; ► детей и подростков — в глазах сверстников (в юном возрасте это воспринимается особенно болезненно, реакция ребенка может быть непредсказуемой); ► законопослушных граждан — в глазах правоохранителей, и т. д. Во многих случаях подобные материалы используются как ин- струмент шантажа, причем выполнение требований преступников бессмысленно. Но это вовсе не гарантирует, что они прекратят свои грязные действия. В последнее время дипфейки стали часто использоваться для бу ял инга. Нив чем не повинная жертва сталкивается с потоком разной компрометирующей информации. Травля может исходить как от одного-двух человек, так и от всего коллектива. Популярные приемы и методы киберпреступников Помимо вышеупомянутых дипфейков и социальной инженерии, интернет-мошенники используются целым арсеналом иных средств и методов, с помощью которых они реализуют свои преступные замыслы. В их числе — так называемый таргетированный фишинг. ИИ используется для быстрого и автоматического сбора информации 17Б
। паснисти искцсственноги интеллекта о человеке. Преступников интересует все: профессиональная деятельность, семья, увлечения, места работы и проживания, предпочтения в выборе товаров, услуг, брендов, варианты про- ведения свободного времени и т. д. Один из важнейших источников информации о человеке — его страницы в социальных сетях. Не стоит выкладывать на нсеобщее обозрение свою жизнь, даже если она складывается очень успешно и хочется похвастаться своими дости- жениями. Минимизируйте количество фотогра- фий и видео, не публикуйте информацию о детях и других родственниках, не распространяйтесь о своем образе жизни, планируемых событиях (отпуск, командировка, свадьба и пр.). Не публи- куйте контент, который позволяет определить ваше местонахождение (адрес или район прожи- вания, расположение дачи, гаража, место отдыха и т. д.). Это лишит мошенников доступа к важной для них информации, которая впоследствии может использоваться для шантажа, запугивания, вымогательства и прочих преступлений. После сбора и анализа информации о человеке мошенники специально для него формируют заманчивое предложение, которое побуждает его перейти на фишинговый ресурс по замаскированной ссылке. Это может быть копия страницы любимого маркетплейса, ресурса по онлайн-бронированию авиабилетов, интернет-банкин- га или любого другого сайта, которым часто пользуется данный человек и где требуется ввод личных данных для авторизации. После того как человек вводит логин, пароль, данные банков ской карты и прочие конфиденциальные сведения, они тут же попадают в руки злоумышленников. Все остальное — вопрос техники: моментально меняется логин и пароль, деньги с карт-сче- та переводятся на реквизиты мошенников, а если преступники 177
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководство завладели паспортными данными, то могут оформить на человека несколько крупных кредитов или займов. Еще один распространенный метод киберпреступников — организованные хакерские атаки. Нейросеть используют для максимально быстрого поиска потенциально уязвимых мест в компьютерах, мобильных устройствах, сайтах, локальных сетях, протоколах передачи данных. Наибольшей опасности подверга- ется незашифрованный график, но даже современные средства криптозащиты не дают стопроцентной гарантии сохранности данных; здесь нужно также учитывать фактор невнимательности и беспечности пользователей, из-за которых ключи защиты попа- дают в руки злоумышленников. В этом направлении мошенники пользуются следующими приемами: ► поиск уязвимостей в системах безопасности; ► имитация компонентов защиты (нейросеть умеет искусно обманывать атакуемые объекты); ► внедрение вредоносных кодов в ПО и операционные сис- темы (с их помощью ведется онлайн-шпионаж, хищение конфиденциальной информации, вывод из строя серверов и локальных компьютеров). Грамотно организованная хакерская атака позволяет похищать большие (десятки и сотни терабайт) объемы информации, с ее помощью можно полностью парализовать 1Т-инфраструктуру компании, корпорации, холдинга. По прогнозам профильных специалистов и независимых экспертов, роль ИИ в построе- нии сложных схем обхода защиты атакуемых объектов будет стремительно расти. При этом кибермошенники стараются опережать время и предугадывать возможные противодействия со стороны систем безопасности. 17е
□пасности искцсставнноги интеллекта Один из изощренных приемов, взятых на вооружение ки- берпреступниками, — преднамеренное искажение баз данных, которые используются для обучения ИИ. Ввод некорректной информации приводит к серьезному нарушению алгоритмов самообучения, анализа, распознавания, идентификации. Это позволяет мошенникам обходить даже самые эффективные интеллектуальные спам-фильтры. Они получают возможность внедрения в систему вредоносных ботов, с помощью которых впоследствии организуются мощные DDoS-атаки. После подоб- ных нападений сайты, локальные сети и прочие ресурсы могут надолго выйти из строя. Искажения при генерации контента Ранее мы уже отмечали, что ИИ не всегда правильно выполняет задания: если у него не хватает информации, он придумывает ее самостоятельно или сам решает, где взять недостающие сведения (пусть даже эти источники сомнительны или просто не подходят для данной ситуации). Убедиться в этом можно, если дать какой-нибудь текстовой ней- росети задание пересказать содержание несуществующей книжки с вымышленным названием. С высокой долей вероятности она сама найдет книгу с названием и автором, приблизительно похожи- ми на тех, что указаны в задании. Например, если попросить И И пересказать содержание книги «Войны в мире» несуществующего автора Толстикова, то он может выдать пересказ романа «Война и мир» Льва Толстого. А если в задании не указывать автора, то нейросеть вполне может пересказать роман «Война миров» Герберта Уэлса. Хотя по идее ИИ в подобной ситуации должен ответить что-то вроде «такой книги не существует». Особую осторожность при работе с текстовыми нейросетями следует проявлять в следующих тематиках: ► психология, медицина (полученный контент ни в коем случае нельзя использовать как руководство для самолечения); 17 g
ГЛАВА Б Безппаснисть и конфиденциальность в цифровую эпоху руководства ► кулинария, рецепты (нейросеть может выдать рекомендацию по распознаванию ядовитого гриба на вкус, восстановлению просроченных продуктов и т. п.); ► финансовая, налоговая, бухгалтерская отчетность; ► подготовка инструкций для спасателей, руководств по тех- нике безопасности. Несколько лет назад в США получила шиоокий резонанс история одного практикующего адво- ката, который решил использовать нейросеть ChatGPT для подготовки документов к предсто- ящему судебному разбирательству. Уже в ходе заседания стало очевидно, что цитаты и ссылки, фигурирующие в документах юриста, выдуман- ные. а дел, на которые он ссылается, никогда не существовало. Так чрезмерная доверчивость адвоката к ИИ обернулась громким провалом на судебном заседании и полным фиаско для его клиента. Не рекомендуется использовать ИИ для расчетов в сфере авиации, инженерного проектирования зданий и сооружений, а также иных сферах, где предъявляются высокие требования к достоверности и точности результатов. Если с помощью нейросети сгенерирован развлекательный контент или изображения, предназначенные для публикации на сайтах, и он оказался искажен или содержит некорректности, это несложно подправить в графическом редакторе. Подобные недочеты некритичны и не приведут к серьезным неприятно- стя м. Но известны примеры, когда ИИ привлекался для улучшения качества изображений, используемых в медицинских целях — например, рентгеновских снимков. При попытках улучшить резкость, увеличить разрешение, устранить шумы нейросеть 1BD
Опасности искусственного интеллекта неправильно понимала задачу. В результате она могла удалить со снимка важные детали, ошибочно воспринимая их как помехи, или наоборот — дорисовывать несуществующие элементы (опу- холи или иные патологии). Такие ошибки чреваты ошибочной постановкой диагноза и. как следствие, неправильно выбранными методами лечения. Стороннее вмешательство в работу систем и оборудования Сегодня многие виды технологического, строительного и про- изводственного оборудования, научной аппаратуры, прочих машин и механизмов работают под управлением или при непо- средственном использовании ИИ. Это позволяет реализовывать масштабные процессы без участия человека. С другой стороны, в случае каких-либо диверсий или провокаций работа оборудо- вания пойдет совсем по другому сценарию, что может привести к непредсказуемым последствиям. Уровень владения современными 1 Г-технологнями позволяет хакерам вмешиваться в работу систем и механизмов, управляемых ИИ. В самом простом случае они могут спровоцировать произ- водственную аварию или поломку оборудования, что приведет к длительным простоям и незапланированным убыткам. Более изощренный способ вредительства с использованием ИИ — корректировка его работы таким образом, чтобы вместо качественной продукции производственное оборудование выпу- скало брак. Для обнаружения такого сбоя потребуется время: как минимум некондицию должна обнаружить внутренняя служба контроля качества. Если этого не произошло (брак неочевиден или трудно распознаваем), испорченная продукция будет сходить с конвейера до получения первых рекламаций от недовольных клиентов. За это время будет испорчено большое количество сырья, впустую потрачено производственное время, а деловая репутация компании серьезно пострадает. 1Н1
ГЛАВА Б Безопасность и конфиденциальность в цифривую эпоху руководства Подобные методы могут использоваться при ведении недобросовестной конкурентной борь- бы. чтобы нанести максимальный финансовый и имиджевый ущерб неугодному предприятию. Но гораздо хуже, когда цель такого вмешатель- ства в работу ИИ — спровоцировать катастрофу с человеческими жертвами. Именно из-за внешней уязвимости пока не получают прак- тического воплощения идеи о массовом производстве беспилот- ных автомобилей. Помимо того, что уровень технологий пока не позволяет реализовывать эти инициативы, много сомнений возникает относительно защищенности ИИ, привлеченного для управления транспортным средством, от хакерства и прочего несанкционированного вмешательства. Если автомобиль с пасса- жирами или грузовик с воспламеняющимся или взрывоопасным грузом перейдет под контроль преступников, сумевших вмешаться в работу нейросетей, могут быть трагические последствия. Обратная сторона медали; как нейросети могут повысить уровень безопасности Многие предприятия и организации используют возможности ИИ для защиты от киберугроз. Это обеспечивает неуязвимость локальных корпоративных сетей, роботизированного оборудования и прочих технологических активов к вмешательству со стороны третьих лиц. Так, сегодня практически по всему миру банки, правительства, представители правоохранительных органов используют ИИ для идентификации личностей. В денежно кредитной сфере, а также при работе с недвижимостью и финансами нейросети исполь- зуют для анализа потенциально опасных ситуаций, выявления IBS
Обратная стирона медали: как нейрисети могут повысить уровень безопасности аномалий и минимизации рисков мошенничества. Рассмотрим несколько направлений, где применение технологий на основе ИИ позволяет повысить уровень безопасности. Распознавание киберугроз Новейшие образцы вредоносного ПО умеют обходить самые эффективные средства защиты, построенные по стандартным алгоритмам. Они используют разные методики преодоления мер кибербезопасности, включая корректировку структуры и кода защитных систем. Но сегодня уже активно используется антивирусное и антишпи- онское ПО, созданное с внедрением технологий ИИ и машинного обучения. Это позволяет почти моментально обнаруживать анома- лии в общей структуре систем безопасности, нарушения логики программирования, а также распознавать малейшие признаки потенциальных угроз. Иначе говоря, нейросеть способна обна- ружить попытки несанкционированного вмешательства на самых разных стадиях и пресечь их еще до того, как злоумышленники построят хакерские элементы и структуры. Для защиты серверов, ноутбуков, мобильных устройств, стаци- онарных компьютеров организации используют специальное ПО, разработанное на основе ИИ и предназначенное для обеспечения безопасности конечных точек. Разработка предсказательных моделей Сегодня многие специалисты в сфере кибербезопасности по- степенно переходят от реактивных к проактивным действиям, используя генеративные функции нейросетей. Акцент делается не столько на реагирование на уже слу- чившиеся события, а на выработку превентивных мер. Это позволяет создавать и успешно внедрять предсказательные модели, снижающие риски за счет быстрой идентификации реальных и потенциальных угроз. Тем самым решаются сле- дующие задачи: 133
ГЛАВА Б Безопасность и конфиденциальность в цифроную эпоху руководства ► максимально быстрое и точное обнаружение опасностей (в большинстве случаев на начальной стадии); ► снижение трудозатрат и финансовых расходов на обеспе- чение безопасности; ► повышение качества реакции на нештатные ситуации; ► высокий уровень защищенности от всех видов рисков. Грамотно выстроенная предсказательная модель на основе ИИ может успешно заменить несколько квалифицированных специалистов по кибербезопасности. Распознавание фишинга Первые факты фишинга были зафиксированы еще в 2000-х годах. С его помощью кибермошенники выманивали у людей все чзо можно: логины, пароли, данные банковских карт, права досту па к конфиденциальным данным и т. д. Хотя с тех пор прошло немало лет, фишинг и сегодня — один из самых эффективных инструментов в арсенале интернет-злоумышленников. При этом преступники постоянно совершенствуют свои навы- ки. Фишинговые письма, вложенные файлы и другие материалы выглядят очень правдоподобно, из-за чего неподготовленному обывателю сложно заметить подвох. Однако специальные защитные барьеры, разработанные с при- менением технологий ИИ, достаточно эффективно распознают попытки фишинга. Этому способствует то, что они постоянно проходят «курсы повышения квалификации». Процесс обучения идет постоянно, причем по двум направлениям. С одной стороны, уполномоченные специалисты закладывают новые и совершенс! вуют старые алгоритмы, обучают нейросеть инновационным приемам и методам. С другой стороны, одно из важных преимуществ ИИ — способность к самообучению: ан- тифишинговые системы быстро совершенствуются, что позволяет им повышать уровень безопасности обслуживаемых ресурсов (компьютеров, сайтов, серверов, мобильных устройств и пр.). 1ВЧ
Обратная стирона медали: как нейросети могут повысить уровень безопасности Одно из эффективных средств защиты от фишинга — специальные фильтры электронной почты, использующие возможности ИИ. Они анализируют содержимое писем и моментально распознают тексты с подозрительными шаблонами; они сразу блокируются. Аналогич- ные методы используются также для борьбы со всеми видами спама. Идентификация и нейтрализация ботов Вредоносные действия ботов способны вывести из строя сайты компании, полностью парализовать корпоративную локальную сеть. В подобной ситуации нормальная деятельность предприя- тия невозможна, в некоторых случаях оно вынуждено временно прекратить работу. Это приводит к незапланированным убыткам, имиджевым потерям, утрате конкурентоспособности и т. д. ИНТЕРЕСНЫЙ Факт Боты могут захватывать аккаунты, похищать учетные записи, помогать киберпреступникам создавать мошеннические схемы и участвовать в самых разных аферах. Для защиты от ботов есть специализированное ПО, работа- ющее с использованием ИИ и моделей на основе машинного обучения. Вот их основные функции: ► постоянный комплексный анализ сетевого трафика; * - легализация данных, оценка их уязвимости к внешним угрозам; ► определение уровня защищенности локальной сети, сер- верных станций и других элементов корпоративной инфра- структуры от несанкционированного вмешательства, а также прочих нештатных ситуаций; ► выявление типовых шаблонов, алгоритмов, а также других характерных признаков, по которым осуществляется иден- тификация ботов; 185
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководство ► предотвращение вредоносной деятельности ботов (они бло- кируются, параллельно с этим уполномоченные специалисты получают сообщение о пресеченных попытках с предостав- лением развернутого отчета). Одно из направлений использования ИИ — разработка за- щитных кодов Captcha, направленных специально против ботов. Защита локальных сетей Для киберпреступников традиционно привлекательны корпора- тивные и прочие локальные сети. Основные направления вредо- носной деятельности: ► похищение конфиденциальной информации (в том числе для последующего шантажа); ► кодирование и шифрование данных, в результате чего поль- зователи теряю г доступ ко всем сетевым ресурсам и ин- формации, а корпоративная сеть парализуется (это один из инструментов вымогательства — за разблокировку просят деньги); ► внедрение шпионского ПО для слежения за работой ком- пании и выманивания корпоративных секретов (этот прием используется при коммерческом шпионаже, ведении эконо- мической разведки и контрразведки). Защитные системы на основе нейросетей осуществляют по- стоянное сканирование и анализ сетевого трафика, проверяют системные журналы на предмет обнаружения несанкционирован- ного доступа, подозрительного программного кода и других сом- нительных моделей. Это позволяет своевременно предотвратить хакерские и DDoS-атаки, взломы и прочие виды вмешательства. Возможности ИИ предусматривают сегментирование локаль- ных сетей на основе анализа основных характеристик и системных требований. 1ВБ
Обратная стирана медали: как нейросети могут повысить уровень Безопасности Повышение эффективности реагирования на нештатные ситуации Использование нейросетей позволяет ускорить ответную реак- цию на возникновение опасных инцидентов. Защитные системы на основе ИИ работают беспрерывно и стабильно, не требуя непосредственного участия человека. Нейросеть не только распознает опасности, но и сама предпринимает действия по их ней- трализации. А технологии машинного обучения позволяют разработать превентивные меры и действовать на упреждение, пресекая опасные инциденты в зародыше Ответные действия вступают в силу почти моментально — в от- личие от ситуаций, когда отражать атаки приходится специалистам ГГ-подразделения. Здесь большое значение имеет способность ИИ к самообучению, поскольку киберпреступники постоянно совершенствуют свои приемы и методы. Фактически работа проходит по принципу «солдат спит, а служба идет»: пока штатные сотрудники офлайн (например, в ночное время или на выходных), решения на основе ИИ ра- ботают в автономном режиме, осуществляя постоянную защиту. Специалистам IT-подразделения при выходе на работу останется лишь ознакомиться с отчетами об отраженных атаках, которые нейросеть генерирует по каждой нештатной ситуации. Нейтрализация внутренних угроз Любой руководитель знает, что внутренние угрозы не менее опасны для предприятия, чем попытки несанкционированного внешнего вмешательства. 1В7
ГЛАВА Б Безопасность и конфиденциальность в цифровую эпоху руководстве Вредоносная деятельность внутри организации может привести к серьезным убыткам, утрате текущих позиций на рынке, порче деловой репутации, утечкам конфиденциальной информации (включая промышленные секреты), иным подобным неприят- ностям. Во многом именно на внутренних угрозах базируется промышленный и коммерческий шпионаж, когда свои же сотруд- ники «сливают» корпоративные секреты прямым конкурентам. Все внутренние угрозы делятся на две категории — преднаме- ренные и случайные. В первом случае речь идет об осознанных действиях, прямо или косвенно направленных на причинение ущерба компании. Случайные угрозы обычно обусловлены не- достаточной компетентностью, отсутствием полномочий, невни- мательностью, халатностью и т. д. Преднамеренные угрозы часто базируются на желании либо дополнительно заработать (злоумышленники подкупают сотрудников предприятия), либо отомстить (например, че- ловека незаслуженно увольняют, и он перед самым уходом назло руководству занимается вредительством). Случайные угрозы не имеют финансовой или эмоциональной подоплеки; это просто стечение обстоятельств. Технологии на основе ИИ позволяют распознавать как предна- меренные, так и случайные внутренние угрозы на ранних стадиях, а также препятствовать их реализации. Нейросеть постоянно мониторит работу сотрудников и по определенным индикаторам распознает их рискованное поведение. Перечень индикаторов для оценки уровня риска постоянно корректируется — во многом благодаря способности ИИ к самообучению. У системы защиты есть полномочия для блокировки пользова- телей (человек с подозрительным поведением лишается доступа к корпоративной сети), запрета на отправку данных внешним 18В
Обратная стирона медали: как нейросети могут повысить уровень Безопасности получателям (включая запись на флешки и другие носители информации), принятие иных экстренным мер по защите I ("-ин- фраструктуры и конфиденциальной информации. Контроль доступа Несанкционированный доступ — оно из самых опасных явлений для любых корпоративных сетей, серверов, локальных рабочих станций и других элементов IT-инфраструктуры. Помимо шпи- онажа и вредительства, это чревато полной остановкой деятель- ности компании: злоумышленники забирают под свой контроль все ресурсы, блокируют документооборот, лишают пользователей возможности авторизоваться и т. д. Предотвратить подобное помогают защитные системы, которые в своей работе используют технологии ИИ. Они повышают уровень безопасности сетевой инфраструктуры и конечных точек (серверов, ноутбуков, мобильных устройств и пр.) с помощью следующих мер: ► блокировка подключений и попыток авторизации с подо- зрительных TP-адресов (их перечень может быть заложен изначально, также нейросеть сама способна сгенерировать список опасных источников); ► идентификация и пометка подозрительных событий, а также анализ ситуаций, при которых возможно их возникновение; ► рекомендации пользователям по повышению уровня защи- ты (обычно предлагается сделать более надежный пароль, а также подключить двухфакторную идентификацию). Для пресечения несанкционированного доступа можно ис- пользовать способности ИИ по верификации пользователей. Одна из самых эффективных мер — идентификация с примене- нием биометрических данных. Также нейросеть может собирать и анализировать сведения о типичном поведении авторизован- ных пользователей в качестве дополнительного инструмента для идентификации личности, и другие меры.
ЗАКЛЮЧЕНИЕ Изучение этой книги помогло всем познакомиться с ИИ, по- нять его сущность и сферы применения, а также освоить основные приемы и методы по созданию текстового, графического и музыкального контента. Теперь вы можете использовать возможности нейросетей как для развлечения, так и в коммерческих целях, а также для решения повседневных задач. Автор выражает надежду, что предложенный материал был полезен и интересен читателям. Предложения и пожелания на- правляйте по адресу: arsen21 l@yandex.ru. Гладкий Алексей Анатольевич
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ A-Z Telegram бот Kandinsky. 100. 101, 105 А Авторские права, 111, 112, 120 Б Бесплатная версия ChatGPT, 28 Г Генеративная модель Kandinsky. 91 Голосовой помощник «Алиса», 48, 145-151 Голосовой помощник «Маруся», 153 Голосовой помощник «Салют», 152 Голосовой чат-бот, 25, 1/1 Интерфейс нейросети, 62, 70, 95, 117, 131 Искусственный интеллект, 143 К Конфиденциальность нейросетей, 14 н Настройка ChatGPT, 39 Негативный промпт, 96. 99, 104 Нейронные сети, 6 Нейросеть Artguru, 61 -64 Нейросеть GigaChat, 70, 78 Нейросеть Kandinsky, 91 Нейросеть RiFfusion, 130, Нейросеть Suno, 119 Нейросеть YandexGPT, 49, 50, 57, 58 о п Платная версия ChatGPT, 22 Подготовка текстовых запросов, 79 Подключение через VPN, 23 Пример генерации текста, 52 Продление музыкальных композиций, 109 Про.мт-режим с YandexGPT, 54, 58, 59, 60 Р Распознавание фотографий. 86 С Самообучение искусе г венного интеллекта, 6 Создание графики, 61 Суперкомпьютер, 7 Создание изображений, 20, 94, 100 Создание музыки, 18, 19. 107. 108, 114, 115, 124, 154, 159 У Умная колонка «Алиса», 145, 149, 151, 152 Ф Функция распознавания лиц, 10 ч Чат бот Artguru, 66 Чат бот ChatGPT, 25 Чат-бот GigaChat, 78 Чат-бог GPT, 25 Чат бот Kandinsky. 105 Чат -бот Suno, 119 Чат-бот Wysa, 143 Обработка естественного языка, 22 Обучение искусственного интеллекта, 95 Я Яндекс 1D, 52