«Люди, использующие ИИ, уже сейчас гораздо эффективнее»: интервью с создателем HyGPT Арменом Атаяном

«Люди, использующие ИИ, уже сейчас гораздо эффективнее»: интервью с создателем HyGPT Арменом Атаяном

Этим летом программист Армен Атаян, бизнес-ангел и основатель компании GEN2B.ai, представил HyGPT — первую крупную языковую модель, адаптированную для восточноармянского языка. Мы побеседовали с Арменом о сложностях разработки, перспективах развития HyGPT и других языковых моделей, а также об этических вопросах использования ИИ.

 

Фотография предоставлена Арменом Атаяном

 

— Армен, расскажите о HyGPT. Что умеет эта языковая модель? Например, может ли она расшифровать аудиозапись на армянском языке?

— Языковые модели работают преимущественно с текстом. Конечно, существуют мультимодальные модели, обученные на текстах, видео и аудио, но они, как правило, доступны крупным компаниям, таким как Google и OpenAI. Наша модель работает только с текстом. Для распознавания речи используются другие модели, так называемые speech-to-text (STT). Подытоживаю: HyGPT не может расшифровывать аудио.

— С какими основными трудностями Вы столкнулись при разработке языковой модели, учитывая ограниченность армяноязычных ресурсов?

— На самом деле, серьёзных трудностей на этот раз не возникло. Мы уже имели подобный опыт, разрабатывая первую казахскую языковую модель Irbis GPT. Вот тогда сложности действительно были, особенно с получением данных. В случае с армянским языком нам повезло: наш партнёр предоставил обширный датасет — 100 гигабайт текста. Мы изучили эти данные и провели исследования, чтобы подобрать подходящую базовую модель. Важно понимать, что мы не создавали модель с нуля. Это потребовало бы миллионов долларов, как это делают крупные компании. Мы взяли за основу существующую модель и дообучили её, фокусируясь на армянском языке. Наша цель была в том, чтобы модель понимала контекст и историю, была ориентирована на общение на армянском. Таким образом, каких-либо непредвиденных проблем в процессе обучения не возникло.

— Вы упомянули о трудностях, с которыми вы столкнулись во время разработки Irbis GPT. Расскажите, в чём заключается сложность работы с языковыми моделями?

— Irbis GPT была первой локальной казахоязычной моделью, и мы были первопроходцами в этом направлении. Одна из основных сложностей заключалась в объёме данных. На казахском языке гораздо меньше литературы, чем, например, на армянском, поскольку носителей казахского языка в стране менее 40%. Казахстан — многонациональная страна, и исторически сложилось так, что доминирует русский язык. Для языковых моделей критически важно иметь большой объём качественных данных на целевом языке. Чем больше текста, тем больше взаимосвязей и закономерностей модель может выявить в построении предложений, что позволяет ей лучше понимать и использовать язык для построения логических цепочек.

Кроме того, сроки разработки Irbis GPT были крайне сжатыми — всего три недели. Нам нужно было сделать то, что до нас никто не делал. Всё это — и ограниченность времени, и новизна задачи, связанная с полным переобучением модели, — создавало определённые трудности.

Самая большая проблема возникла с получением данных. Мы пытались получить их от правительства, но из-за ряда препятствий это не осуществилось. В итоге мы использовали собственные данные, которые искали и переводили. Первая версия модели стала своего рода proof of concept, демонстрацией того, что подобная разработка возможна. После этого мы решили сосредоточиться на создании качественной модели, способной выполнять практические задачи. Как раз в это время я познакомился с коллегами из Армении, рассказал о своём желании создать армянскую языковую модель, и мне быстро предоставили необходимый датасет. Наличие готовых данных для качественного обучения стало решающим фактором в пользу разработки HyGPT.

— Если говорить о перспективах этих моделей: возможно ли их совершенствовать и развивать далее?

— Смысл локальных моделей, таких как HyGPT, в отличие от моделей OpenAI или Google, заключается в возможности их дообучения для выполнения конкретных задач и сценариев. Их можно адаптировать под нужды бизнеса или пользователей. Главное преимущество локальных моделей — работа в автономном режиме, без доступа к интернету. Кроме того, их можно дообучать под специфические задачи с меньшими затратами ресурсов, чем раньше.

— Актуально ли создание подобной языковой модели для западноармянского языка? Есть ли такой запрос?

— Да, запросы на разработку модели для западноармянского языка поступали. Вопрос в наличии данных. Когда я буду в Армении, обязательно подниму этот вопрос. Думаю, в будущем мы сможем разработать такую модель.

 

Фотография предоставлена Арменом Атаяном

 

— С какими ещё языками планируете работать в ближайшей перспективе?

— Сейчас мы ведём переговоры с правительством Люксембурга о создании первой люксембургской языковой модели. Также есть планы по работе с узбекским языком. Там ситуация сложнее, чем с армянским, из-за смены алфавита с кириллицы на латиницу. Более того, появились дополнительные буквы, и это создаёт сложности для моделей. Разработка модели, которая понимает тексты и на кириллице, и на латинице, работая при этом локально, — большой вызов.

— Насколько вы довольны HyGPT? Как оцениваете свой вклад в приближение будущего?

— Я очень рад, что у меня есть возможность выпустить эту модель бесплатно в открытый доступ (open source) для личного пользования. Любой желающий может использовать её, в том числе и в коммерческих целях. Есть ряд направлений, где требуется получение дополнительного разрешения, поскольку развёртывание и дообучение таких моделей в крупных структурах имеет свои особенности. Думаю, это вклад в развитие AI-сообщества в Армении. Теперь любой желающий может взять эту модель и дообучить её под свои задачи, использовать в своих проектах, например, для создания специализированных агентов. Для работы с армянским языком эта модель будет очень полезна.

— Если говорить об искусственном интеллекте в общем, то что бы Вы сказали людям, которые по сей день, несмотря на цифровизацию и обилие информации, опасаются ИИ или не понимают, зачем он нужен?

— Ситуация очень похожа на период индустриализации, когда люди переходили от ручного труда к фабрикам. Можно провести аналогию и с появлением интернета: многие не понимали его предназначения, но в итоге всем пришлось научиться с ним работать. Те, кто не освоил этот инструмент, стали менее востребованными. Сейчас сложно представить сотрудника, не умеющего пользоваться интернетом. То же самое произойдёт и с искусственным интеллектом. Люди и компании, использующие его, будут на порядок эффективнее. Этот процесс неизбежен, он уже становится реальностью. Модели с каждым годом совершенствуются, обрабатывают всё больший объём задач автономно и в некоторых областях уже превосходят людей.

Например, в сфере коммуникации с клиентами, которой занимаемся и мы, ИИ демонстрирует гораздо более высокую эффективность, чем люди. С каждым годом модели становятся всё более способными, и уже близок тот момент, когда большинство бизнес-процессов будут управляться искусственным интеллектом.

— Как Вы думаете, удастся ли решить этический вопрос, связанный с ответственностью при использовании ИИ? Пример, ставший классикой: робот-хирург совершает ошибку во время операции. Кто виноват: программист, хирург или компания-разработчик? Как разрешить этот конфликт?

— Это сложный вопрос, однозначного ответа на который пока нет. Можно провести аналогию с автомобилем: если водитель попадает в аварию по своей вине, ответственность лежит на нём. Если же авария произошла из-за производственного брака, ответственность несёт производитель. То же самое и с ИИ. Если с помощью ИИ человек добивается негативных результатов, ответственность лежит на том, кто его использует или настраивает. Если же ошибка происходит из-за сбоя в самой модели, ситуация сложнее.

Были случаи, когда ИИ давал негативные советы или даже рекомендовал самоубийство, например, в роли психотерапевта. В таких ситуациях возникает вопрос: кто виноват — компания, использующая ИИ, или компания-разработчик? На мой взгляд, основную ответственность несёт та компания, которая использовала ИИ при создании своего продукта. Хотя однозначного ответа нет, на данный момент за ошибки ИИ отвечают компании, которые создали с его помощью конечный продукт. Каждый случай индивидуален, и, как и в любых человеческих ситуациях, нужно рассматривать все обстоятельства.

— Какие проблемы, возникающие в связи с развитием ИИ, действительно важны, а какие, на Ваш взгляд, надуманы?

— Главная ценность ИИ сейчас — это автоматизация рутинных процессов. Особое внимание стоит уделить ИИ, способному понимать человеческую речь, логику и на основе этого выполнять действия. Искусственный интеллект используется с 80-х годов, но нынешний ажиотаж связан с появлением моделей, способных понимать человеческий язык и действовать в соответствии с ним. Это открывает невероятные возможности для автоматизации. Сегодня ИИ может, общаясь с человеком, самостоятельно принимать решения. Например, голосовые роботы (а это уже реальность) могут забронировать столик в ресторане, подключившись к системам бронирования. То, что раньше делали люди, нажимая кнопки на экране, теперь может делать ИИ.

С этической точки зрения, проблема в том, что ИИ может заменить слишком много профессий, и человечество к этому не готово. Это грозит массовой безработицей, в первую очередь в сфере обслуживания клиентов, поддержки и коммуникации. Мы видим, как ИИ активно используется в видеоредактировании и создании изображений. Поэтому мой совет — начать использовать эти инструменты и повышать свою эффективность. Люди, использующие ИИ, уже сейчас гораздо эффективнее. Программисты пишут код совместно с ИИ, который также проверяет этот код. Например, у наших разработчиков эффективность повысилась на 50%, и этот процент будет расти.

Языковые модели снижают ценность человеческого интеллекта в его прежнем понимании. Раньше ценился опыт и обширные знания. Сейчас это меняется, аналогично тому, как мы перестали запоминать номера телефонов, пользуясь записной книжкой в смартфоне. Наша память ухудшается, потому что всё хранится в устройствах. Интеллект становится доступнее, как и сама разработка. Если раньше для создания приложения требовалась команда из 7-8 человек, то сейчас, благодаря новым подходам, например, vibe-кодингу один человек может создать приложение, просто общаясь с ИИ и описывая свои требования. Это уже реальность. Создавать телеграм-ботов может любой, кто способен чётко сформулировать задачу для ИИ. Поэтому нужно учиться создавать решения на базе ИИ. Один человек может сделать то, что раньше делала целая команда. Я бы порекомендовал всем развиваться в этом направлении, потому что сейчас любые идеи можно реализовать очень быстро.


«Люди, использующие ИИ, уже сейчас гораздо эффективнее»: интервью с создателем HyGPT Арменом Атаяном