Сидельников Вячеслав Георгиевич : другие произведения.

Литература И Теория Информации

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:


 Ваша оценка:
  • Аннотация:
    В этой статье проведены исследования информативности литературных произведений.

  
  Опыт применения теории информации при оценке литературных произведений
  
  Введение
  
   В 1947-1948г.г. американский математик Клод Шеннон указал на область математики, которую назвал "теорией информации".
   На практике очень часто приходится сталкиваться с опытами, могущими давать различные результаты в зависимости от обстоятельств, которые мы не умеем учесть. Например, при бросании игральной кости мы не можем знать заранее, какая из граней окажется сверху, так как это зависит от очень многих неизвестных нам обстоятельств (деталей движения руки, бросающей кость, положение игральной кости в момент броска, особенностей поверхности, на которую падает кость и.т.д.).
   Применение математики к изучению явлений такого рода опирается на то, что во многих случаях при многократном повторении одного и того же опыта в одних и тех же условиях частота появления рассматриваемого результата остаётся всё время примерно одинаковой, близкой к некоторому числу "Р". Это постоянное число называется вероятностью рассматриваемого события. Другими словами, вероятность некоторого события равна отношению числа равновероятных исходов, благоприятных для данного события, к общему числу равновероятных исходов.
   Для практики важно уметь численно оценивать степень неопределённости самых разнообразных опытов, чтобы иметь возможность сравнить их с этой стороны. Последнее условие наталкивает на мысль принять за меру неопределённости опыта, имеющего "К" равновероятных исходов число "log K". Такое определение меры неопределённости согласуется с условиями, что при К=1 она равна нулю и что при возрастании "К" она возрастает.
   Выбор основания логарифмов здесь несуществен .
  Переход от одной системы логарифмов к другой сводится лишь к умножению функции f(x)=log K на постоянный множитель, то есть равна простому изменению единицы измерения степени неопределённости. В конкретных применениях "меры неопределённости" обычно используют логарифмы по основанию "два". Это означает, что за единицу измерения степени неопределённости здесь принимается неопределённость, содержащаяся в опыте, имеющим "два" равновероятных исхода.
  
  Такая единица измерения неопределённости называется БИТОМ. Если используется логарифмы по основанию "10", то такая единица называется ДИТОМ.
   В качестве меры неопределённости используется величина Н(а)=pi log pi, где pi - вероятность i - го события и принято её называть ЭНТРОПИЕЙ.
   Так как - "pi log pi" равно нулю лишь при pi =0 или pi=1, то ясно, что энтропия Н(а) опыта (а) равна нулю лишь в том случае, когда одна из вероятностей Р1,Р2...Рi равна единице, а все остальные равны нулю. Это обстоятельство хорошо согласуется со смыслом величины Н(а) как меры неопределённости: действительно, только в этом случае опыт вообще не содержит никакой неопределённости.
   Приведём пример. Русский текст содержит "N" признаков - это буквы от А до Я, а так же: ".", ",", ":", ";", "-", "!", "?", пробел, всего 42 признака .Энтропия опыта при условии, что все признаки считаются одинаково вероятными равна Но На самом деле в русском языке разных признаков не одинаково вероятно. Строго говоря, эти частоты зависят от характера текста. Например, в учебнике по высшей математике частоты обычно очень редкой буквы "Ф" заметно выше средней из-за частого повторения слов "функция", "дифференциал", "коэффициент". Большие отклонения от нормы в частоте употребления отдельных признаков можно наблюдать в некоторых художественных произведениях, особенно в стихах. Например, в стихотворении К.Д. Бальмонта "Камыши" (Полночной порою в болотной глуши чуть слышно, бесшумно шуршат камыши...) всё построено на обыгрывании шипящих звуков "Ч" и "Ш". Суммарная энтропия появления соответствующих признаков в выбранном тексте определяется выражением: Н(а)= РаlogPa+PбlogРб+т.д. Неравномерность появления признаков содержащихся в выбранном тексте осуществляется сравнением значения Н(а) с величиной Но=log N по формуле: К =Н(а)/Н(о) (1).
   Величина Н(а) индивидуальна для каждого автора, написавшего стихи или прозу, о чём было сказано выше.
   Следует так же отметить, что величина "К" зависит от объёма опытов. Например, в словах "Я встретил Вас..." из известного романса Тютчева Ф. содержится информация равная 60,6% от максимально возможной - log 42, в словах "Я встретил Вас и всё былое..." - 66,7%, в словах "Я встретил Вас и всё былое в отжившем сердце ожило..." - 71,7%. Из этого следует вывод, что
  формула (1) для определения количества информации того или иного литературного сочинения верна.
   Приведённая выше формула для расчёта объёма информации можно использовать когда событие представляет собой числовой ряд N1,N2,N3 и т.д.Для оценки качества литературных произведений может быть использована теория информации. В настоящей работе излагается способ оценки литературных сочинений по фонетическому и морфологическому признакам.
  1. Оценка качества литературных произведений по фонетическому признаку
   Для оценки качества литературных сочинений предлагается следующая формула:
   Кф = 1/logN*(Nа/n/logNа/n+Nб/nlogNб/n +и т.д. (2),
   где Кф - коэффициент значимости литературного произведения по фонетическому признаку;
   N - число признаков. В нашем случае N = 42, а log 42 = 5.343;
   N i - число опытов, в котором наблюдается признак;
   n - общее число производимых опытов.
   В число признаков входит русский буквенный алфавит от буквы "А" до буквы "Я" включительно, а так же "точка", "запятая", "двоеточие", "точка с запятой", "тире", "кавычки", "восклицательный знак", "вопросительный знак", "пробел". Всего 42 признака.
   Расчёт коэффициента значимости по фонетическому признаку покажем на примере стихотворений А.С. Пушкина "Зимний вечер" , "Песнь о вещем Олеге" и "Я помню чудное мгновение".
  Автором этих строк была создана программа ВИХРЬ ,в которой реализованы вычисления Кф. Алгоритм расчётов Кф для стихотворения "Зимний вечер приводим ниже.
  КП * ДискD *документы * файл Зимний вечер * выделяем текст файла * ПМ *копировать * диск D * программы * ВИХРЬ * ПМ * вставить *текст файла появился на рабочем столе программы ВИХРЬ * фонетический признак. Видим таблицу расчётов, где показаны количество букв: А=52,Б=12 и т.д., всего 745 букв и знаков * Ni/n * Ni/nlog Ni/n =4,613 *log42=5.392*Кэф=85,56%. Для стихотворения"Песнь о Вещем Олеге " параметр Кф равен 85,63%,а для стихотворения "Я помню чудное мгновение"-84,20%.
  
  2.Оценка качества литературных произведений по морфологическому признаку
  
   Для оценки качества литературных сочинений по морфологическому признаку предлагается следующая формула:
   Км = 1/log N(Na/nlogNa/n+Nб/nlogNб/n+и т.д.) (3),
  Где Км - коэффициент значимости литературного произведения по морфологическому признаку;
  N - число признаков. В нашем случае N = 13
  Ni - число опытов, в котором наблюдается признак;
  n - общее число производимых опытов.
   В число признаков входит: существительное(а) , прилагательное(б) , числительное(в) , местоимение(г) , глагол(д) , причастие(е) , деепричастие(ж) , наречие(з) , предлог(и) , союз(к) , частица(л) , междометие(м) , звукоподражательное слово(н) . Всего 13 признаков. Расчёты Км проведены при помощи программы ВИХРЬ по вышеизложенной методике.
   Км для стихотворений "Зимний вечер", "Песнь о вещем Олеге" и "Я помню чудное мгновение" соответственно составляет: 69,63% , 68,08% и 60,21%
   В целом коэффициент значимости по фонетическому и морфологическому признакам для стихотворений "Зимний вечер" , "Песнь о вещем Олеге" и "Я помню чудное мгновение" составляет соответственно: 77,60%,76,86% и 72,20%.
   Из теории статистики известно, что результат получается более объективным, если число опытов стремится к бесконечности. В реальных условиях мы имеем дело с конечным числом признаков и опытов над ними. И чем больше число опытов, тем точнее результат.
   Таким образом, по совокупности фонетических и морфологических признаков наиболее информативно стихотворение "Зимний вечер", затем "Песнь о вещем Олеге" и далее "Я помню чудное мгновенье".
  
  
  3. Литературные приложения
  
  Зимний вечер Я помню чудное мгновенье
  
  Буря мглою небо кроет, Я помню чудное мгновенье:
  Вихри снежные крутя; Передо мной явилась ты,
  То, как зверь, она завоет, Как мимолётное виденье,
  То заплачет, как дитя, Как гений чистой красоты.
  То по кровле обветшалой В томленьях грусти безнадёжной,
  Вдруг соломой зашумит, В тревогах шумной суеты,
  То, как путник запоздалый, И снились милые черты.
  К нам в окошко застучит.
   Шли годы. Бурь порыв мятежный
  Наша ветхая лачужка Рассеял прежние мечты,
  И печальна, и темна. И я забыл твой голос нежный,
  Что же , моя старушка, Твои небесные черты.
  Приумолкла у окна? В глуши, во мраке заточенья
  Или бури завываньем Тянулись тихо дни мои
  Ты, мой друг, утомлена, Без божества, без вдохновенья,
  Или дремлешь под жужжаньем Без слёз, без жизни, без любви.
  Своего веретена?
   Душе настало пробужденье:
  Выпьем, добрая подружка И вот опять явилась ты,
  Бедной юности моей, Как мимолётное виденье,
  Выпьем с горя; где же кружка? Как гений чистой красоты.
  Сердцу будет веселей. И сердце бьётся в упоенье,
  Спой мне песню, как синица И для него воскресли вновь
  Тихо за морем жила; И божество, и вдохновенье,
  Спой мне песню, как девица И жизнь, и слёзы, и любовь.
  За водой поутру шла.
  
  Буря мглою небо кроет,
  Вихри снежные крутя;
  То, как зверь, она завоет,
  То заплачет, как дитя.
  Выпьем, добрая подружка
  Бедной юности моей,
  Выпьем с горя; где же кружка?
  Сердцу будет веселей.
  
  
  
  Песнь о вещем Олеге
  
  Как ныне сбирается вещий Олег Покройте попоной, мохнатым ковром,
  Отмстить неразумным хазарам, В мой луг под уздцы отведите;
  Их села и нивы за буйный набег Купайте; кормите отборным зерном,
  Обрек он мечам и пожарам; Водой ключевою поите".
  С дружиной своей, в цареградской броне, И отроки тотчас с конём отошли,
  Князь по полю едет на верном коне. А князю другого коня подвели.
  
  Из тёмного леса навстречу ему Пирует с дружиною вещий Олег
  Идёт вдохновенный кудесник, При звоне весёлом стакана.
  Покорный Перуну старик одному, И кудри их белы, как утренний снег
  Заветов грядущего вестник, Над славной главою кургана...
  В мольбах и гаданьях проведший весь век. Они поминают минувшие дни
  И к мудрому старцу подъехал Олег. И битвы, где вместе рубились они...
  
  "Скажи мне, кудесник, любимец богов, "А где мой товарищ? - промолвил Олег: -
  Что сбудется в жизни со мною? Скажите, где конь мой ретивый?
  И скоро ль, на радость соседей-врагов, Здоров ли? Всё так же ль лёгок на бек?
  Могильной засыплюсь землёю? Всё тот же ль он бурный, игривый?"
  Открой мне всё правду, не бойся меня: И внемлет ответу: на холме крутом
  В награду любого возьмёшь ты коня". Давно уж почил непробудным он сном.
  
  "Волхвы не боятся могучих владык, Могучий Олег головою поник
  А княжеский жар им не нужен; И думает: " Что же гаданье?
  Правдив и свободен их вещий язык Кудесник, ты лживый, безумный старик!
  И с волей небесною дружен. Презреть бы твоё предсказанье!
  Грядущие годы таятся во мгле; Мой конь и до ныне носил бы меня"
  Но вижу твой жребий на светлом челе. И хочет увидеть он кости меня.
  
  Запомни же ныне ты слово моё: Вот едет могучий Олег со двора,
  Воителю слава - отрада; С ним Игорь и старые кости,
  Победой прославлено имя твоё; И видят - на холме, у брега Днепра,
  Твой щит на вратах Цареграда; Лежат благородные кости;
  И волны и суша покорны тебе; Их моют дожди, засыпает их пыль,
  Завидует недруг столь дивной судьбе. И ветер волнует над ними ковыль.
  
  И синего моря обманчивый вал Князь тихо на череп коня наступил
  В часы роковой непогоды, И молвил: "Спи, друг одинокий!
  И пращ, и стрела, и лукавый кинжал Твой старый хозяин тебя пережил:
  Щадят победители годы... На тризне, уже недалёкой
  Под грозной бронёй ты ведаешь ран; Не ты под секирой ковыль обагришь
  Незримый хранитель могущему дан. И жаркою кровью мой прах напоишь!
  
  Твой конь не боится опасных трудов; Так вот где таилась погибель моя!
  Он, чуя господскую волю, Мне смертью кость угрожала!"
  То смирный стоит под стрелами врагов, Из мёртвой главы гробовая змея
  То мчится по бранному полю. Шипя между тем выползала;
  И холод и сеча ему ничего... Как чёрная лента, вкруг ног обвилась,
  Но примешь ты смерть от коня своего" И вскрикнул внезапно ужаленный князь.
  
  Олег усмехнулся - однако чело Ковши круговые, запенясь, шипят
  И взор омрачился думой. На тризне плачевной Олега;
  В молчаньи, рукой опершись на седло, Князь Игорь и Ольга на холме сидят;
  С коня он слезает, угрюмый; Дружина пирует у брега;
  И верного друга прощальной рукой Бойцы поминают минувшие дни
  И гладит и треплет по шее крутой. И битвы, где вместе рубились они!
  
  "Прощай, мой товарищ, мой верный слуга,
  Расстаться настало нам время;
  Теперь отдыхай! Уж не ступит нога
  В твоё позлащённое стремя.
  Прощай, утешайся - да помни меня.
  Вы, отроки - други, возьмите коня,
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  Выводы и рекомендации
  
  1) В данной статье реализовано применение теории информации для оценки значимости литературных произведений.
  2) Оценка значимости осуществлялась по фонетическому и по морфологическому признакам.
  3) Оценка информативности по фонетическому и морфологическому признакам осуществлялась по формулам (2) и (3).
  4) Формула (2) с успехом использована при оценке качества музыкальных произведений.
  5) Небольшие произведения из-за отсутствия ряда признаков имеют незначительные по величине коэффициенты значимости.
  6) Очень большие по объёму сочинения могут быть разбиты на части, равномерно расположенных по всему произведению. Здесь имеется тенденция асимтотического приближения коэффициента значимости к некоторой величине, характерной для манеры письма данного автора.
  7) В исследовании литературных произведений с применением теории информации так же могут быть использованы синтаксический, стилистический, эмоциональный и другие признаки, которые могут всесторонне оценить творчество прозаиков и поэтов.
  8) В данной статье определена информативность стихотворений А. С. Пушкина "Зимний вечер", "Песнь о вещем Олеге" и "Я помню чудное мгновенье", соответственно имеющих коэффициент значимости 77,60%, 76,86% и 72,2%.
  9) Теория информации при оценке информативности (значимости) может быть использована при глубоких лингвистических исследованиях творчества литераторов.
  10) Для быстроты вышеперечисленных расчётов составлена программа для компьютера под условным названием "ВИХРЬ". Следует отметить, что фонетику программа считает быстро, а морфологию в течение нескольких минут, в зависимости от длины текста. На примере "Капитанской дочки" Пушкина А. С. имеем: Кф=83,54% А=3919 шт.,Б=862 шт. n=57190 ш.т. Км=62,47% существительных=4967шт. прилагательных=889шт. n=9501шт. в среднем для фонетики и морфологии К=73,00%
  
  Список использованной литературы
  
  
  1) Баранов М.Т. и другие "Русский язык" - справочные материалы. Издательство "Просвещение", Москва, 1989г.
  2) Вентцель Е.С. "Теория вероятностей", Москва, 1962г.
  3) Яглом А.М. и другие "Вероятность и информация", Москва, Издательство "Наука", 1973г.
  
  
  
  
  
  
  
  
  
  
  
  
  
 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список
Сайт - "Художники" .. || .. Доска об'явлений "Книги"