Щеглов Виталий Николаевич : другие произведения.

О планировании исследований

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:


 Ваша оценка:


   О планировании исследований
  
   Эта статья предназначена для специалистов по искусственному интеллекту (ИИ) и для специалистов по физиологии высшей нервной деятельности (ВНД). Также она может быть интересна инженерам-технологам.
   Перед чтением статьи желательно ознакомиться с книгой автора "Творческое сознание ..." и (для сравнения!) со сравнительно недавними лекциями К. Анохина на Utube, где он говорит о своих поисках теории сознания...
  
   Вспоминаю, ~ в 1965 году на химфаке МГУ ак. Спицын предложил мне аспирантскую тему по планированию экспериментов. В то время я работал в ОКБА Северодонецкого химкомбината (Луг. обл.) и занимался оптимизацией управления реактора синтеза метанола. Проводить на нем активные эксперименты было нельзя, можно было лишь с помощью множества датчиков регистрировать его поведение как некоторого живого существа, которое "живет" в сложной изменяющейся среде. Нужно было найти приемлемый для практической работы инженеров и проектировщиков метод декомпозиции (факторизации) массива численных данных, отображающих функционирование реактора. Прежде всего, нужно было находить простые качественные выводы из массива исходных данных Х.
   Был найден весьма удачный метод логической факторизации исходного Х. Для всех переменных х вычислим их медианы или близкие к ним значения (важно, чтобы эта точка разбиения не совпадали со значениями х!). Запишем соответствующий массив булевых значений переменных как ХБ(0, 1), где 0 - значение х меньше своей медианы, а 1 - больше. Переменная, которая является функцией У всех остальных х, после введения булевых значений обозначим как Z (столбец в правой части ХБ). В общем смысле далее все булевы 1 и 0 являются некоторыми непересекающимися множествами, например, натуральных чисел из Х (там также могут быть переменные, имеющие изначально значения булевых 1 или 0). Все массивы ХБ булевых чисел являются частным случаем отделяемого пространства Хаусдорфа, которое характерно при отображении логических функций ВНД.
   Строки из ХБ пусть отображают состояния объекта исследования, они записываются последовательно ниже во времени Т (пусть это будет первая переменная в виде столбца натуральных чисел).
   Кратко об алгоритме вычисления булевых моделей массива ХБ.
   Пусть цель исследования Z=1. Пусть далее каждой целевой строке соответствует ее локальное время То=0. В дальнейшем будем для каждой целевой строки вычислять ее окрестность нецелевых строк, упорядочивая их по возрастанию модуля локального времени, отсчитываемого от То. Для объектов, зависящих от Т, их ближайшие состояния более сходны, чем удаленные. Обычно при регистрации Х не имеют возможности учета множества "несущественных" или "скрытых" переменных, имеющих свою динамику развития. Основной этап алгоритма - последовательное сравнение целевой строки со своей ближайшей окрестностью нецелевых строк не только ускоряет вычисления, но и удовлетворяет очевидному смыслу существования исследуемого объекта как нечто единого целого со всей окружающей средой, как системы. В пределе, при весьма малых интервалах Т мала вероятность больших изменений для многих "скрытых" переменных по сравнению с большими интервалами Т. При сравнениях со своей ближайшей окрестностью исследователь надеется получать такие выводы К, которые будут меньше "зашумлены" скрытыми переменными (для систем, близким к стационарным).
   Дальнейшие вычисления сходны: строятся конъюнкции К минимального ранга, т.е. до тех пор, когда К станет импликацией для всех строк из Z=1, куда входит эта К. Далее вычисляются оценки Г для каждой К и, начиная с наибольшей Г(К), минимальным числом таких упорядоченных К "покрываем" все строки для Z=1, т.е. строим тупиковую дизъюнктивную форму булевой модели (всё аналогично вычисляется и для Z=0). (Эти вычисления весьма похоже на выработку условных рефлексов по И.П. Павлову!)
   Булевы модели удобны на исходной стадии планирования дальнейших исследований сложных объектов, рассматриваемых как нечто целое, как система.
   Интерпретация булевых х в импликациях К в терминах "больше" или "меньше" они своих медиан, помогает исследователю пробуждать свою память и интуицию - указывает на такие содержательные примеры или теории, где наблюдаются именно такие же взаимодействия переменных х. Это позволяет, например, более обоснованно планировать направление дальнейших исследований. При этом сама запись булевой модели является как бы планом реализации заданной цели Z=1. "Обратная" модель здесь указывает, "что не надо делать" для управляемых Х или указывает на не желаемое взаимодействия булевых областей значений неуправляемых переменных. Устойчивость булевых моделей зависит от того, насколько массив ХБ отображает существенные х. Для нестационарных систем все зависит от скорости "обучения": сбора новой информации и скорости вычислений.
   Булевы модели стали широко использоваться моими последователями примерно с 1965 года, более точные даты см. в списке литературы в моей книге "Творческое сознание ...".
  
   Примерно в 1982 году автором был разработан метод вычисления булевых моделей в интервальной форме, которая была названа в его кандидатской (докторской у его шефа!) диссертации как "Алгебраические модели конструктивной логики" (АМКЛ), в более общем смысле - информационные модели (алгоритмы) сознания. В этой форме булевой была лишь целевая функция Z(1, 0), а массив исходных данных Х содержал лишь натуральные числа, булевы переменные пусть здесь отображаются также натуральными числами, например, (1, 2), содержательный смысл их записывается отдельно. Алгоритм вычисления существенных переменных здесь состоит в сравнении каждой целевой строки массива Х со своей ближайшей окрестностью нецелевых строк. Вычисляются постепенно уменьшающиеся открытые (вначале многомерные) интервалы dх целевых значений х, некоторые из них обнуляются. Наконец, обнуляется последний - шаг назад, он запоминается. Проверяется гипотеза К: если dх, то Z=1 по всем нецелевым строкам и помечаются номера строк, где гипотеза ложна. Опять выбирается исходная целевая строка и подобным образом определяют второй интервал для некоторой иной переменной. Далее гипотезы формулируются как конъюнкции этих интервалов и т.д. ранг К постепенно растет до тех пор пока К не станет ложной для всех нецелевых строк. Эта истинная импликация для исходной целевой строки запоминается, вычисляется ее оценка Г. Далее подобным образом вычисляются К для всех целевых строк. Остальные операции аналогичны методу булевых моделей. (Заметим, что алгоритм вычисления АМКЛ отображает интуиционистское исчисление предикатов).
   По сравнению с булевыми моделями АМКЛ отображают наборы таких минимальных (но открытых!) областей К из Х, "попадание" в которые соответствует оптимизации исследуемой системы (для Z=1). С практической точки зрения здесь АМКЛ, например, является записью нового регламента производства (если оно близко к стационарному) или это рекомендации, или план дополнительных расчетов, например, для проектирования более совершенных реакторов.
   Смысл "обратной" модели здесь состоит в указании на существование не желательных областей или режимов К, которых следует избегать.
   Об аналитической форме АМКЛ при исследовании объекта как системы.
   Множества значений Х, включенные в К при больших Г, иногда могут быть аппроксимированы, например, рядами Эрмита (полагаем, что массив Х содержит также столбец натуральных чисел функции цели У). Системный подход в данном случае заключается в том, что все эти функции Эрмита относятся здесь к классу обобщенных функций: в реальности существует некоторая единая функция У в аналитическом виде, которую мы пытаемся отобразить в наиболее простом виде. Пусть такая функция отображает некоторую единую многолистную поверхность вроде раскрытой книги, для корешка которой У принимает свое медианное значение. Пусть также вне К У равен своей медиане. Пусть эта априорная информация при вычислении статистических оценок дает нам дополнительно по 2 степени свободы для каждой аппроксимируемой К, последовательно выбираемой из их упорядоченного по уменьшению Г списка. Саму аппроксимацию лучше производить постепенно. Выбираем К с максимальным Г для Z=1 и К для Z=0, которая содержит наибольшее число переменных х, одинаковых при сравнении с содержащимися х в первой выбранной К.
   (Формулы, относящиеся к рядам Эрмита, см. в книге П. Антосика и ... "Теория обобщенных функций").
   В самом начале для статистических оценок желательно задать наибольшую допустимую ошибку модели, возможно, далее ее удастся уменьшить. Затем таким же образом выбирается следующая пара К и т.д. вплоть до увеличения ошибки всей модели в целом.
   Для наглядности приведем возможный зрительный образ такой модели объекта как системы (набора таких обобщенных функций). Построим для наглядности весьма упрощенную геометрическую модель системы S. Пусть, например, ранг всех отобранных К равен шести. Частично "замостим" поверхность достаточно большой сферы S выпуклыми шестиугольниками, их общее число пусть будет равно числу всех аппроксимированных К, а стороны этих шестиугольников пусть соответствуют открытым интервалам, содержащим натуральные числа, например, от 1 до 99. "Замощение" поверхности сферы S желательно производить наиболее компактным образом: каждый последующий шестиугольник использует интервал того же самого х, который ранее чаще встречался.
   Открытость интервалов здесь означает лишь то, что, продвигаясь далее за концы такого интервала, мы встречаем числа, имеющие по своему происхождению иную природу, это совершенно другие переменные х!
   Целевая функция У пусть проходит по радиусу S и через центр каждого шестиугольника К. Пусть ее медиана соответствует поверхности S и открытый интервал для значений У, например, (1, ..., 99) направлен выше S, а открытый интервал значений (-1, ..., -99) ниже поверхности S.
   (Как и ранее, мы здесь имеем дело с отделяемым, т.е. Хаусдорфомым пространством, характерным для многих функций нашего сознания!)
   В итоге внешний вид модели S похож на глобус: медиана для У соответствует уровню моря, аппроксимации К, где Z=1, это континенты, острова, горы; где Z=0, это моря, большие глубины. Результаты обработки новых массивов Х помещаются на S отдельно: угол поворота сферы пусть отображает дату записи новой информации.
   Интересной особенностью аналитической формы АМКЛ является ее "аналитическое продолжение" уже вычисленных ("достоверных") рядов Эрмита или их преобразований Фурье. Все это тесно связано с прогнозированием поведения S или с дальнейшим планированием исследований. Достоверные аппроксимации в виде рядов Фурье (волновые свойства систем S) интересны также с познавательной точки зрения.
   При прогнозировании иногда требуется вводить в Х некоторые дополнительные параметры, например, конечные разности для некоторых х между ближайшими состояниями объекта. Надо помнить, что при этом уменьшается число степеней свободы при статистической оценке модели объекта.
   Планирование исследования S желательно начинать с вычисления ее булевой модели, явно способствующей проявлению интуиции у исследователя. Содержательная интерпретация интервальной формы АМКЛ также возможна при обширном информационном поиске по массивам подходящих литературных данных. Иногда на их основе возможно добавление в Х новых существенных переменных. Здесь возникает как бы вариационный подход: при большой скорости вычислений различных новых АМКЛ. В этом случае всегда можем выделить более информационную модель.
   С точки зрения физиологии ВНД переменные х это отдельные нейроны или их группы (отдельные сети). С лингвистической точки зрения переменные х это словарь используемого языка (а Х это исследуемый текст). Здесь также возможно введение х, значения которого являются, например, требуемых по тексту ссылок, в частности, на хранящиеся в памяти ранее вычисленные модели.
   В последнее время АМКЛ широко используются в работах моих последователей на медицинском факультете Тульского университета.
   Литература
   http://samlib.ru/editors/s/sheglow_w_n/ind
   http://publ.lib.ru/ARCHIVES/SCH/SCHEGLOV_Vitaliy_Nikolaevich/_Scheglov_V.N..html
   https://drive.google.com/drive/folders/0B8UW6pCzyM-7UVpoODdCdU9XOU0?hl=ru
   https://vitshcheg-cor.livejournal.com
   https://vk.com/id15458753
   22.03.2021 г.
  
  
  
  
  

 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список
Сайт - "Художники" .. || .. Доска об'явлений "Книги"