Код документа: RU2692241C1
Изобретение относится к области пожарной и промышленной безопасности (разработка методов и способов исследования взрывопожароопасных свойств веществ и материалов) и может быть применено для определения группы взрывоопасной смеси [ГОСТ 12.1.011-78 (СТ СЭВ 2775-80) ССБТ. Смеси взрывоопасные. Классификация и методы испытаний] для выбора типа взрывозащищенного электрооборудования, при разработке мероприятий по обеспечению пожаровзрывобезопасности технологических процессов в различных отраслях промышленности (нефтегазовая, фармацевтическая отрасль и др.).
Сущность: в качестве основных элементов предлагаемого способа выступают молекулярные дескрипторы и искусственные нейронные сети (ИНС) «back-propagation» (обратного распространения) с учетом использования метода усовершенствования градиентного спуска.
Технической задачей изобретения является определение пожароопасных показателей, в частности температуры самовоспламенения, антрахинона и красителей на его основе.
Известен способ прогнозирования пожароопасных свойств веществ на основе данных об углеродной цепи, в соответствии с которым проводится анализ зависимостей температур вспышки, воспламенения, самовоспламенения, температурных и концентрационных пределов от длины углеводородной цепи, позволяющий определить линейные и степенные показатели пожарной опасности. [Алексеев С.Г., Барбин Н.М., Алексеев К.С., Орлов С.А. Связь показателей пожарной опасности с химическим строением. I. Алканолы // Пожаровзрывобезопасность. - 2010. - Т. 19. - №5. - С. 23-30.]
Недостатком известного способа является то, что метод углеродной цепи (МУЦ) позволяет прогнозировать свойства веществ лишь в пределах одного гомологического ряда.
Близким по прогнозированию пожароопасных свойств веществ и получению значений является фрагментный способ прогнозирования «Способ Pintar». В основе его лежит построение корреляционных зависимостей от количества i структурных групп (фрагментов) химической формулы и структурных дескрипторов соседнего вещества. Осуществляя взаимосвязь между НКПВ и стехиометрическим коэффициентом перед кислородом (β) и числом атомов углерода (NC) и водорода (NH) можно определить среднюю длину молекулы и попытаться рассчитать необходимый пожаровзрывоопасный показатель вещества [
К недостаткам данного способа относится необходимость составления аппроксимационных уравнений и их дальнейшее решение. Все это влечет за собой большие временные затраты, тем самым накладывая ограничения на определение физико-химических свойств веществ.
Технической задачей изобретения является определение пожароопасных показателей, в частности температуры самовоспламенения, антрахинона и красителей на его основе и повышение точности прогнозирования, а это позволит решить главную проблему - обеспечение пожарной безопасности промышленных объектов путем использования веществ и материалов с заранее известными или заданными свойствами.
Существующие ИНС имеют несколько "узких мест". Во-первых, в процессе обучения может возникнуть ситуация, когда большие положительные или отрицательные значения весовых коэффициентов сместят рабочую точку на сигмоидах многих нейронов в область насыщения. Малые величины производной от логистической функции приведут в соответствие с (1) и (2) к остановке обучения, что парализует НС.
Во-вторых, применение метода градиентного спуска не гарантирует, что будет найден глобальный, а не локальный минимум целевой функции. Эта проблема связана еще с одной, а именно - с выбором величины скорости обучения. Доказательство сходимости обучения в процессе обратного распространения основано на производных, то есть приращения весов и, следовательно, скорость обучения должны быть бесконечно малыми, однако в этом случае обучение будет происходить неприемлемо медленно. С другой стороны, слишком большие коррекции весов могут привести к постоянной неустойчивости процесса обучения. Поэтому в качестве η обычно выбирается число меньше 1, но не очень маленькое, например, 0.1, и оно, может постепенно уменьшаться в процессе обучения. Кроме тою, для исключения случайных попаданий в локальные минимумы иногда, после того как значения весовых коэффициентов застабилизируются, η кратковременно сильно увеличивают, чтобы начать градиентный спуск из новой точки. Если повторение этой процедуры несколько раз приведет алгоритм в одно и то же состояние ИНС, можно более или менее уверенно сказать, что найден глобальный максимум, а не какой-то другой.
Простейший метод градиентного спуска очень неэффективен в случае, когда производные по различным весам сильно отличаются. Это соответствует ситуации, когда значение функции S для некоторых нейронов близко по модулю к 1 или когда модуль некоторых весов много больше 1. В этом случае для плавного уменьшения ошибки надо выбирать очень маленькую скорость обучения, но при этом обучение может занять много времени.
Поэтому поставленная задача достигается тем, что в экспресс-способе прогнозирования пожароопасных свойств антрахинона и красителей на его основе, в частности температуры самовоспламенения, включающем формирование базы данных молекулярных дескрипторов, состоящей из основных физико-химических свойств рассматриваемых веществ, новым является то, что применяемая сеть обратного распространения использует метод усовершенствованного градиентного спуска.
Таким методом является введение момента m, когда влияние градиента на изменение весов изменяется со временем. Тогда прогнозирование будет осуществляться по следующей математической формуле (3):
Дополнительным преимуществом от введения момента является способность алгоритма преодолевать мелкие локальные минимумы.
Кроме того, применяя «back-propagation» с усовершенствованным градиентным спуском получается чрезвычайно эффективный способ нахождения градиента функции ошибки
Напротив, прямое вычисление градиента по формуле:
потребовало бы от ω прямых прогонов через сеть, требующих σ(ω) операций каждый. Таким образом, неоптимизированный алгоритм имеет сложность σ(ω2), что существенно хуже, чем у алгоритма back-propagation.
Технический результат заключается в возможности определения пожароопасных показателей, в частности температуры самовоспламенения и повышении точности анализа.
Способ осуществляется следующим образом.
1) Определение объектов исследования и необходимый параметр для прогнозирования (в нашем случае температура самовоспламенения твердых горючих веществ);
2) Осуществляется формирование базы данных. База данных представляет собой молекулярные дескрипторы. Под молекулярным дескриптором понимается закодированная информация о веществе, представленная в виде цифровых значений. Поэтому для описания строения молекул обучающей выборки исследуемых соединений применяются молекулярные дескрипторы структурной формулы: Wiener index, Randic index (order 0), Randic index (order 1), Randic index (order 2), Randic index (order 3), Kier&Hall index (order 0), Kier&Hall index (order 1), Kier&Hall index (order 2), Kier&Hall index (order 3), Kier shape index (order 1), Kier shape index (order 2), Kier shape index (order 3), Kier flexibility index, Average Information content (order 0), Information content (order 0), Average Structural Information content (order 0), Structural Information content (order 0), Average Complementary Information content (order 0), Complementary Information content (order 0), Average Bonding Information content (order 0), Bonding Information content (order 0), Average Information content (order 1), Information content (order 1), Average Structural Information content (order 1), Structural Information content (order 1), Average Complementary Information content (order 1), Complementary Information content (order 1), Average Bonding Information content (order I), Bonding Information content (order 1), Average Information content (order 2), Information content (order 2), Average Structural Information content (order 2), Structural Information content (order 2), Average Complementary Information content (order 2), Complementary Information content (order 2), Average Bonding Information content (order 2), Bonding Information content (order 2), Balaban index) и др., которые наиболее точно описывают разницу в строении между структурными изомерами.
Часть основной базы данных, применяемой в прогнозировании представлена ниже в виде таблице 1.
Использование большого количества вводимой информации, дает прогноз с меньшим процентом погрешности. Единственным ограничением является использование молекулярных дескрипторов одного класса, в пределах прогнозирования пожароопасных свойств того же класса веществ.
Обучающая выборка, используемая для обучения данной нейросети, формируется при помощи специальной процедуры на основании данных, полученных при формировании молекулярных дескрипторов [заявка №2018670011 на регистрацию базы данных «Значения молекулярных дескрипторов для кислородсодержащих производных углеводородов и красителей (сложные эфиры масляной и пропионовой кислот, антрахинон и красители на его основе)»].
Объем обучающей выборки является одним из важнейших условий правильного обучения сети и ее последующего функционирования. Так неверно подобранная обучающая выборка может стать причиной переобучения нейронной сети. Это явление характерно для сети с большим числом весов, которая моделирует более сложные зависимости, и представляет собой чрезмерно точную подгонку, которая имеет место, если алгоритм обучения работает слишком долго, а сеть слишком сложна для такой задачи или для имеющегося объема данных.
3) Определяем параметры сети.
Пусть ω- число синаптических весов сети (weights), а p- число обучающих примеров (patterns). Тогда для однократного вычисления градиента функции ошибки
Отметим, что алгоритм действует итеративно, и его шаги принято называть эпохами.
3.1. На каждой эпохе на вход сети поочередно подаются все обучающие наблюдения, выходные значения сети сравниваются с целевыми значениями и вычисляется ошибка. Значение ошибки, а также градиента поверхности ошибок используются для корректировки весов, после чего все действия повторяются.
3.2. Начальная конфигурация сети (значения весов) выбирается случайным образом, и процесс обучения прекращается, когда пройдено определенное количество эпох, или, когда ошибка достигнет некоторого определенного заданного пользователем значения или вовсе перестанет уменьшаться (пользователь сам может выбрать нужное условие остановки).
3.3. Сети с большим числом весов моделируют более сложные функции, и, следовательно, склонны к переобучению. Сети же с небольшим числом весов могут оказаться недостаточно гибкими, чтобы смоделировать имеющиеся зависимости. Например, сеть без открытых слоев моделирует лишь обычную линейную функцию.
3.4. Для определения «правильной» степени сложности сети будем использовать механизм контрольной проверки. Для этого резервируем часть обучающих наблюдений и не будем использовать их в обучении по алгоритму обратного распространения. Вместо этого, по мере работы алгоритма, будем использовать их для независимого контроля результата. В самом начале работы ошибка сети на обучающем и контрольном множестве будет одинаковой (если они существенно отличаются, то, вероятно, разбиение всех наблюдений на два множества было неоднородно). По мере того, как сеть обучается, ошибка обучения, естественно, убывает, и, пока обучение уменьшает действительную функцию ошибок, ошибка на контрольном множестве также будет убывать. Если та же контрольная ошибка перестала убывать или даже стала расти, это указывает на то, что сеть начала слишком близко аппроксимировать данные и обучение следует остановить. Это явление слишком точной аппроксимации и является переобучением. В таком случае необходимо уменьшить число скрытых элементов и/или слоев, так как сеть является слишком мощной для данной задачи. Если же сеть, наоборот, была взята недостаточно сильной для того, чтобы моделировать имеющуюся зависимость, то переобучения, скорее всего, не произойдет, и обе ошибки - обучения и проверки - не достигнут достаточного уровня малости.
При этом объем обучающей выборки увеличивается, что требует более мощной конфигурации сети. Также для эффективного обучения необходимо соблюдение следующего условия: число обучающих наблюдений должно быть намного больше общего числа весов и пороговых коэффициентов. Однако слишком большой объем обучающей выборки при выбранной конфигурации сети приводит к увеличению времени обучения, но не к улучшению способности сети распознавать запахи.
4. Таким образом, для возможности проведения отдельных экспериментов и удобства пользователя в программе «Нейропакет КДС 2.0» [заявка о государственной регистрации программ для ЭВМ №2018613776]. Программный продукт, совмещает модульное и иконное представление результатов функционирования искусственной нейронной сети с реализацией усовершенствованных процедур обучения. При этом объектно-ориентированный дизайн позволяет рассматривать нейронную сеть в виде нейронных компонентов.
Работоспособность программы основана на проектировании персептронов, который адекватно реагирует на предоставленные примеры (молекулярные дескрипторы изученных веществ). Причем, при увеличении числа нейронов внутреннего слоя персептрона, погрешность обучения обычно падает. Таким образом, моделируется искусственная нейронная сеть с «N» - количеством входов, одним выходом и скрытыми слоями. Особенностью программного продукта является то, что теперь применяемая искусственная нейронная сеть обратного распространения использует метод усовершенствованного градиентного спуска. [Д.С. Королев, С.А. Кончаков Компьютерные программы обработки пожароопасных характеристик веществ/ Современные технологии обеспечения гражданской обороны и ликвидации последствий чрезвычайных ситуаций: сборник статей по материалам VI Всероссийской научно-практической конференции с международным участием. Воронежский институт - филиал ФГБОУ ВО Ивановской пожарно-спасательной академии ГПС МЧС России. 19 апреля 2018 г.].
Данный способ имеет универсальное применение для прогнозирования пожароопасных свойств веществ, в том числе при получении продуктов с заданными свойствами. Ниже приведен пример реализации предлагаемого способа. В качестве объектов исследования выбраны антрахинон и красители на его основе.
Некоторые физико-химические свойства исследуемых веществ представлены в табл. 2. [Корольченко А.Я., Корольченко Д.А. Пожаровзрывоопасность веществ и материалов и средства их тушения: справочник. - В 2-х ч. - 2-е изд., перераб. и доп. - М.: Асс. "Пожнаука", 2004. - Ч. I. - 713 с.; Корольченко А.Я., Корольченко Д.А. Пожаровзрывоопасность веществ и материалов и средства их тушения: справочник. - В 2-х ч. - 2-е изд., перераб. и доп. - М.: Асс. "Пожнаука", 2004. - Ч. II. - 774 с]
Пример 1.
В качестве исходных данных использовали молекулярные дескрипторы антрахинона и красителей на его основе (таблица 1), коррелирующие с температурой самовоспламенения веществ (R2>0,9): топологические индексы - индекс Винера W (Wiener index), индекс Рандича χ (Randic index), геометрические дескрипторы - площадь поверхности молекулы S (Molecular surface area) и гравитационные индексы (Gravitation index) - G1 (all bonds) и G2 (all pairs), а их структурные формулы представлены на рисунке 1.
Для проверки работы искусственной сети и верификации данных спрогнозировали температуру самовоспламенения исследуемых веществ.
Обучение ИНС осуществляется при помощи алгоритма «back-propagation» (обратного распространения) с учетом использования метода усовершенствования градиентного спуска. Затем добавляли к изученным параметрам, новую выборку и осуществляли прогноз. Способ осуществим. Полученные результаты представлены в табл.3.
Пример 2.
С целью прогнозирования новых свойств, а именно температуры самовоспламенения предельных альдегидов, повторяли все действия как указано в примере 1. Способ осуществим. Получили значения температуры самовоспламенения (табл. 4)
Пример 3.
Для прогнозирования температуры самовоспламенения, повторяли все действия как указано в примере 1. Способ осуществим. Получили значения температуры самовоспламенения (табл. 5)
Пример 4.
Для прогнозирования температуры самовоспламенения, повторяли все действия как указано в примере 1. Способ осуществим. Получили значения температуры самовоспламенения (табл. 6)
Пример 5.
Для прогнозирования температуры самовоспламенения, повторяли все действия как указано в примере 1. Способ осуществим. Получили значения температуры самовоспламенения (табл. 7)
Из примеров 1-5 и табл. 3-7 следует, что наибольший эффект по предлагаемому способу прогнозирования температуры самовоспламенения, включающему удовлетворительную верификацию данных и прогнозирование новых свойств веществ, достигается с применением «Нейропакета КДС 2.0», реализующий обучение ИНС при помощи алгоритма «back-propagation» (обратного распространения) с учетом использования метода усовершенствования градиентного спуска.
Таким образом способ прогнозирования пожароопасных свойств антрахинона и красителей на его базе, основанный на использовании молекулярных дескрипторов и искусственных нейронных сетей позволяет:
- повысить оперативность прогнозирования пожароопасных свойств веществ за счет отсутствия сложных математических вычислений;
- расширить справочную и нормативную литературу новыми физико-химическими свойствами веществ;
- исключить условия образования горючей среды за счет возможности прогнозировать свойства еще не синтезированных веществ;
- исключить условия образования источников зажигания за счет возможности решения спорных вопрос при выборе температурного класса взрывозащищенного электрооборудования;
- применять полученные значения температуры самовоспламенения для определения группы взрывоопасной смеси для выбора типа взрывозащищенного электрооборудования, при разработке мероприятий по обеспечению пожаровзрывобезопасности технологических процессов в различных отраслях промышленности (нефтегазовая, фармацевтическая отрасль и др.).
- оптимизировать расходы на обеспечении пожарной безопасности.
Изобретение относится к области пожарной и промышленной безопасности (разработка методов и способов исследования взрывопожароопасных свойств веществ и материалов) и может быть применено для определения группы взрывоопасной смеси для выбора типа взрывозащищенного электрооборудования, при разработке мероприятий по обеспечению пожаровзрывобезопасности технологических процессов в различных отраслях промышленности. Сущность: в качестве основных элементов предлагаемого способа выступают молекулярные дескрипторы и искусственные нейронные сети (ИНС) «back-propagation» (обратного распространения) с учетом использования метода усовершенствования градиентного спуска, в котором введен момент m, когда влияние градиента на изменение весов изменяется со временем. Технической задачей изобретения является определение пожароопасных показателей, в частности температуры самовоспламенения, антрахинона и красителей на его основе. Поставленная задача достигается тем, что в экспресс-способе прогнозирования пожароопасных свойств антрахинона и красителей на его основе, в частности температуры самовоспламенения, включающем формирование базы данных молекулярных дескрипторов, состоящей из основных физико-химических свойств рассматриваемых веществ, новым является то, что применяемая сеть обратного распространения использует метод усовершенствованного градиентного спуска. Таким методом является введение момента m, когда влияние градиента на изменение весов изменяется со временем. Дополнительным преимуществом от введения момента является способность алгоритма преодолевать мелкие локальные минимумы. Кроме того, применяя «back-propagation» с усовершенствованным градиентным спуском получается чрезвычайно эффективный способ нахождения градиента функции ошибки. Технический результат заключается в возможности определения пожароопасных показателей, в частности температуры самовоспламенения, и повышении точности анализа. 7 табл., 1 ил., 5 пр.
Экспресс-способ прогнозирования пожароопасных свойств предельных кетонов с использованием молекулярных дескрипторов и искусственных нейронных сетей