Компания «Норникель» запустила собственную специализированную языковую модель MetalGPT-1, предназначенную для горнорудной промышленности и металлургической отрасли. В отличие от универсальных моделей, созданных на основе интернет-данных, эта разработка ориентирована именно на специфическую профессиональную терминологию. Тем самым сокращаются сложные производственные процессы, что значительно уменьшает риск ошибочных выводов и повышает точность рекомендаций ИИ-решений.
Созданная модель обеспечивает универсальный языковой интерфейс для инженерных, технических, производственных и корпоративных задач. На ее основе компания «Норникель» разрабатывает индивидуальных ИИ-ассистентов и автономных агентов, интегрируя их в операционную деятельность предприятия.

Модель языкового анализа содержит 32 миллиарда параметров и была обучена на массиве специализированных текстов объемом порядка 10 гигабайт — объеме знаний, примерно равном половине английской версии Википедии. Главное достоинство этой модели заключается в качестве исходных данных: она обучалась на закрытой корпоративной документации объемом свыше миллиона единиц, включая техрегламенты, инструкции компаний, чертежи проектов, патентные описания, результаты научных исследований и технической литературы.
Вся эта информация прошла тщательную обработку, очистку и анонимизацию, что позволило внедрить уникальные отраслевые знания без нарушения конфиденциальности коммерческих секретов. Для повышения точности работы дополнительно были сформированы около полумиллиона примеров вопросов и инструкций, основанных на реальных производственных ситуациях и исследовательских задачах. Это помогает модели точнее выявлять взаимосвязи технологических процессов и выдавать надежные, защищенные от ошибок ответы.
Металлургия – один из самых сложных отраслевых доменов со своим языком процессов, аббревиатур и терминов. Универсальные модели, обученные на общем веб-корпусе, теряют точность на таком специализированном языке, а крупномасштабные модели требуют колоссальных вычислительных ресурсов. MetalGPT-1 — это доменная модель на 32 миллиарда параметров, специально оптимизированная под металлургию. На промышленном бенчмарке она показывает очень значимый для отрасли уровень понимания металлургического языка при ресурсах, доступных для реального промышленного применения. Каждая компания теперь может адаптировать модель под свои задачи, — рассказал руководитель направления по развитию искусственного интеллекта «Норникеля» Данил Ивашечкин.
На создание MetalGPT-1 потребовался почти год напряженной работы: полгода специалисты потратили на сбор и предварительную обработку необходимых данных, два месяца заняло базовое обучение системы, после чего еще 2 месяца потребовались на специализированную адаптацию и точную настройку модели.
Чтобы объективно оценить качество модели, инженеры «Норникеля» разработали тестовый набор вопросов и ответов, охватывающий широкий спектр процессов добывающей и перерабатывающей промышленности.
Компания разместила готовую версию модели MetalGPT-1 вместе с промышленным бенчмарком на платформе Hugging Face, открыв доступ всему индустриальному сообществу к инструментам разработки специализированных решений. Расширяя таким образом возможности экосистемы промышленных приложений на основе доменных языковых моделей.



