В Бауманке автоматизировали обучение языковых моделей

Учёные НОЦ ФНС России и МГТУ им. Н.Э. Баумана разработали автоматизированный сценарий настройки языковых моделей, позволяющий адаптировать ИИ под конкретные измеримые задачи без ручного перебора параметров. Решение направлено на повышение точности, скорости работы и соблюдение заданных форматов в зависимости от целей использования модели. Об этом пишет сайт вуза.

Разработчики объяснили, что высокая эффективность модели достигается за счёт оптимизации ключевых показателей. Для ускорения работы используются суррогатные модели, которые заранее оценивают разные конфигурации ИИ. Это позволяет примерно в 1,6 раза сократить число комплексных проверок системы на наличие вредоносных объектов, уменьшить объём ресурсоёмких вычислений и ускорить настройку примерно на 40% времени без потери качества. Эксперименты показали, что метод стабильно превосходит традиционные подходы, в том числе по покрытию кода.

«Система автоматически подбирает оптимальные конфигурации под разные задачи — от максимальной скорости до наивысшей точности, избавляя разработчиков от необходимости вручную тестировать сотни вариантов», — отметил д.т.н., ведущий научный сотрудник НОЦ ФНС России и МГТУ им. Н.Э. Баумана Игорь Масич.

По его словам, разработка ориентирована на практическое применение и может использоваться в промышленных ИИ-сервисах, а также при создании специализированных решений для государственных и корпоративных задач.

«Модель предлагает разработчику не одну универсальную настройку, а целый набор оптимизированных вариантов под разные задачи. Если проекту важна скорость — можно выбрать быструю конфигурацию с хорошим качеством. Если критична точность — доступен вариант с максимальной точностью, который работает чуть дольше. Разработчики сами настраивают ИИ-инструменты, исходя из своих целей», — пояснил учёный.

Разработка была представлена на Международной конференции высшего ранга A* по автоматизированной разработке программного обеспечения ASE 2025 в Сеуле.

Разработка относится к классу систем автоматического машинного обучения (Automated Machine Learning). Проще говоря, это ИИ, который способен выполнять часть работы дата-сайентиста: автоматически настраивать и подбирать модели под конкретные задачи на основе данных. Сама идея AutoML не нова, но появление больших языковых моделей (Large language model — программ искусственного интеллекта, которые могут распознавать и генерировать текст) требует новых подходов и инструментов, поэтому технологию можно считать актуальной и полезной, отметил д.т.н., руководитель Национального центра когнитивных разработок ИТМО Александр Бухановский.

«Технология МГТУ им. Н.Э. Баумана ориентирована на отдельные ИИ-модели, однако в перспективе она может быть особенно востребована при создании мультиагентных систем на базе больших фундаментальных моделей. В таких системах одна и та же ИИ-модель может использоваться разными агентами, но с разными настройками — по точности, скорости и другим параметрам», — уточнил эксперт.

Тематики: Интеграция, ПО

Ключевые слова: автоматизация процессов, Искусственный интеллект, Машинное обучение (ML)