SlideShare una empresa de Scribd logo
1 de 4
Descargar para leer sin conexión
1. Открыть программу SemioRed и сформировать xml файлы песнопений.




                              Рис.1. Главная форма программы SemioRed

   1)   Нажать кнопку «Открыть Word» и выбрать файл с песнопением
   2)   Выбрать вкладку Знамя+Слог
   3)   Нажать кнопку «Создать»
   4)   Сохранить xml файл

2. Удалить мета-данные из xml-файлы
   Нужно удалить то, что выделено красным цветом в примере:

   <?xml version="1.0" standalone="yes"?>
   <DATAPACKET Version="2.0">
     <METADATA>
       <FIELDS>
        <FIELD attrname="Id" fieldtype="i4" readonly="true" SUBTYPE="Autoinc" />
        <FIELD attrname="Znam" fieldtype="string" WIDTH="10" />
        <FIELD attrname="Slog" fieldtype="string" WIDTH="10" />
        <FIELD attrname="Stil" fieldtype="string" WIDTH="100" />
        <FIELD attrname="VPom" fieldtype="string" WIDTH="10" />
        <FIELD attrname="DPom" fieldtype="string" WIDTH="5" />
       </FIELDS>
       <PARAMS AUTOINCVALUE="109" />
      </METADATA>
      <ROWDATA>
       <ROW …
   ..
   />
      </ROWDATA>
   </DATAPACKET>
3. Открыть программу Semantic_Statistik и построить частотные словники




                           Рис.2. Главная форма программы Semantic_Statistik

         1) Иногда xml-файлы содержат ошибки кодировки (недопустимые знаки и т.п.). Поэтому,
            прежде чем начать работу необходимо проверить исходный файл и пересохранить его
            ( кнопки 1 и 2 на рис.2)
         2) Нажать на кнопку «Создать частотный словник»
         3) В итоге будет создан документ в программе Word, содержащий частотную таблицу,
            пример которой показан ниже. В первом столбце записывается «код » знамени, во
            втором - знамя, в третьем – частоты.

«код » знамени                   знамя                          частота

76                               a                              15

121                              L                              4

77                               a                              3

89                               d                              2

-74                              A                              2

88                               d                              1

166                              b                              1

140                              Z                              1
В дальнейшем нам потребуются столбцы, выделенные в примере серым цветом.

4. Открыть Excel – заготовку и найти закон распределения частот знамен




   Рис.3. Excel лист для поиска закона распределения

   1) Заменить частотный словник (Столбцы A и B)
   2) Проставить ранги знамен (если у знаменс одинаковой частотой один ранг)
⎧      � 𝑦 𝑖 = 𝑁 ∗ 𝐶0 + � 𝑥 𝑖 ∗ 𝐶1 + � 𝑥 2 ∗ 𝐶2
         3) Составить матрицу для решения системы уравнений:

                                                                          𝑖
                                 ⎪
                                     � 𝑥 𝑖 𝑦 𝑖 = � 𝑥 𝑖 ∗ 𝐶0 + � 𝑥 2 ∗ 𝐶1 + � 𝑥 3 ∗ 𝐶2
                                 ⎨
                                                                  𝑖            𝑖

                                 ⎪� 𝑥 2 𝑦 = � 𝑥 2 ∗ 𝐶 + � 𝑥 3 ∗ 𝐶 + � 𝑥 4 ∗ 𝐶
                                 ⎩    𝑖 𝑖       𝑖    0      𝑖    1      𝑖    2




 𝑦 𝑖 = ln(𝑁 𝑖 /𝑁),

 𝑁 𝑖 − частота 𝑖 − го знамени ; 𝑁 − количество знамен в пеcнопении

𝑥 𝑖 = 𝑙𝑛𝑅 𝑖

𝑅 𝑖 − ранг 𝑖 − го знамени

i(k,r)/k = p (r+v) –b

     2 ∗ 𝐶2
𝑣=
        𝐶1

𝑝 = 𝑒 𝐶0 +𝑏∗ln(1+𝑣)

𝑏 = −𝐶1 (1 + 𝑣)

         4) Перейти на «Лист2» и найти коэффициенты 𝐶0 , 𝐶1 и 𝐶2 и параметры v, b и p закона
            Мандельброта:
            i(k,r) = pk (r+v) -b, где i(k,r) — частота слова в тексте, k — общее число слов в тексте, r —
            ранг слова
         5) Проделать аналогичные вычисления для поиска параметров закона распределения
            Ципфа:
            i(k, r) = pk r-b.
            См. Лист 3 и 4.

Más contenido relacionado

Similar a Short instruction laba1

Mikhail Roytberg - Sequence Analysis (from Biology to Linguistics) Part3
Mikhail Roytberg - Sequence Analysis (from Biology to Linguistics) Part3Mikhail Roytberg - Sequence Analysis (from Biology to Linguistics) Part3
Mikhail Roytberg - Sequence Analysis (from Biology to Linguistics) Part3Uralcsclub
 
повторение 7кл. алгебра
повторение 7кл. алгебраповторение 7кл. алгебра
повторение 7кл. алгебраLyudmila Yefremova
 
алгебра и начала мат. анализа. 10кл. (баз. и проф. ур.) колягин ю.м. и др 201...
алгебра и начала мат. анализа. 10кл. (баз. и проф. ур.) колягин ю.м. и др 201...алгебра и начала мат. анализа. 10кл. (баз. и проф. ур.) колягин ю.м. и др 201...
алгебра и начала мат. анализа. 10кл. (баз. и проф. ур.) колягин ю.м. и др 201...adgjm73458
 
Лекция #5. Введение в язык программирования Python 3
Лекция #5. Введение в язык программирования Python 3Лекция #5. Введение в язык программирования Python 3
Лекция #5. Введение в язык программирования Python 3Яковенко Кирилл
 
Коды Адамара. Каскадные коды Форни.
Коды Адамара. Каскадные коды Форни.Коды Адамара. Каскадные коды Форни.
Коды Адамара. Каскадные коды Форни.Alex Dainiak
 
Задача о ближайшем кодовом слове. Коды Галлагера—Сипсера—Шпильмана
Задача о ближайшем кодовом слове. Коды Галлагера—Сипсера—ШпильманаЗадача о ближайшем кодовом слове. Коды Галлагера—Сипсера—Шпильмана
Задача о ближайшем кодовом слове. Коды Галлагера—Сипсера—ШпильманаAlex Dainiak
 
массивы.строки
массивы.строкимассивы.строки
массивы.строкиdasha2012
 
Hf labs education day. rocket science
Hf labs education day. rocket scienceHf labs education day. rocket science
Hf labs education day. rocket scienceOlga Kiseleva
 
Элементы дискретной математики для программистов
Элементы дискретной математики для программистовЭлементы дискретной математики для программистов
Элементы дискретной математики для программистовDEVTYPE
 
Презентация на тему: Методические особенности подготовки учащихся к выполнени...
Презентация на тему: Методические особенности подготовки учащихся к выполнени...Презентация на тему: Методические особенности подготовки учащихся к выполнени...
Презентация на тему: Методические особенности подготовки учащихся к выполнени...2berkas
 
Алгоритмы и структуры данных осень 2013 лекция 1
Алгоритмы и структуры данных осень 2013 лекция 1Алгоритмы и структуры данных осень 2013 лекция 1
Алгоритмы и структуры данных осень 2013 лекция 1Technopark
 
Дополнительные возможности Javascript
Дополнительные возможности JavascriptДополнительные возможности Javascript
Дополнительные возможности JavascriptDenis Latushkin
 
Основы языка Питон: типы данных, операторы
Основы языка Питон: типы данных, операторыОсновы языка Питон: типы данных, операторы
Основы языка Питон: типы данных, операторыTheoretical mechanics department
 
Развитие технологий генерации эксплойтов на основе анализа бинарного кода
Развитие технологий генерации эксплойтов на основе анализа бинарного кодаРазвитие технологий генерации эксплойтов на основе анализа бинарного кода
Развитие технологий генерации эксплойтов на основе анализа бинарного кодаPositive Hack Days
 

Similar a Short instruction laba1 (20)

Mikhail Roytberg - Sequence Analysis (from Biology to Linguistics) Part3
Mikhail Roytberg - Sequence Analysis (from Biology to Linguistics) Part3Mikhail Roytberg - Sequence Analysis (from Biology to Linguistics) Part3
Mikhail Roytberg - Sequence Analysis (from Biology to Linguistics) Part3
 
Rgsu04
Rgsu04Rgsu04
Rgsu04
 
Rgsu04
Rgsu04Rgsu04
Rgsu04
 
повторение 7кл. алгебра
повторение 7кл. алгебраповторение 7кл. алгебра
повторение 7кл. алгебра
 
10 a k
10 a k10 a k
10 a k
 
алгебра и начала мат. анализа. 10кл. (баз. и проф. ур.) колягин ю.м. и др 201...
алгебра и начала мат. анализа. 10кл. (баз. и проф. ур.) колягин ю.м. и др 201...алгебра и начала мат. анализа. 10кл. (баз. и проф. ур.) колягин ю.м. и др 201...
алгебра и начала мат. анализа. 10кл. (баз. и проф. ур.) колягин ю.м. и др 201...
 
Лекция #5. Введение в язык программирования Python 3
Лекция #5. Введение в язык программирования Python 3Лекция #5. Введение в язык программирования Python 3
Лекция #5. Введение в язык программирования Python 3
 
Коды Адамара. Каскадные коды Форни.
Коды Адамара. Каскадные коды Форни.Коды Адамара. Каскадные коды Форни.
Коды Адамара. Каскадные коды Форни.
 
Задача о ближайшем кодовом слове. Коды Галлагера—Сипсера—Шпильмана
Задача о ближайшем кодовом слове. Коды Галлагера—Сипсера—ШпильманаЗадача о ближайшем кодовом слове. Коды Галлагера—Сипсера—Шпильмана
Задача о ближайшем кодовом слове. Коды Галлагера—Сипсера—Шпильмана
 
Step cpp0201
Step cpp0201Step cpp0201
Step cpp0201
 
массивы.строки
массивы.строкимассивы.строки
массивы.строки
 
PascalABC.NET 2015-2016
PascalABC.NET 2015-2016PascalABC.NET 2015-2016
PascalABC.NET 2015-2016
 
Hf labs education day. rocket science
Hf labs education day. rocket scienceHf labs education day. rocket science
Hf labs education day. rocket science
 
Элементы дискретной математики для программистов
Элементы дискретной математики для программистовЭлементы дискретной математики для программистов
Элементы дискретной математики для программистов
 
9 ср1
9 ср19 ср1
9 ср1
 
Презентация на тему: Методические особенности подготовки учащихся к выполнени...
Презентация на тему: Методические особенности подготовки учащихся к выполнени...Презентация на тему: Методические особенности подготовки учащихся к выполнени...
Презентация на тему: Методические особенности подготовки учащихся к выполнени...
 
Алгоритмы и структуры данных осень 2013 лекция 1
Алгоритмы и структуры данных осень 2013 лекция 1Алгоритмы и структуры данных осень 2013 лекция 1
Алгоритмы и структуры данных осень 2013 лекция 1
 
Дополнительные возможности Javascript
Дополнительные возможности JavascriptДополнительные возможности Javascript
Дополнительные возможности Javascript
 
Основы языка Питон: типы данных, операторы
Основы языка Питон: типы данных, операторыОсновы языка Питон: типы данных, операторы
Основы языка Питон: типы данных, операторы
 
Развитие технологий генерации эксплойтов на основе анализа бинарного кода
Развитие технологий генерации эксплойтов на основе анализа бинарного кодаРазвитие технологий генерации эксплойтов на основе анализа бинарного кода
Развитие технологий генерации эксплойтов на основе анализа бинарного кода
 

Short instruction laba1

  • 1. 1. Открыть программу SemioRed и сформировать xml файлы песнопений. Рис.1. Главная форма программы SemioRed 1) Нажать кнопку «Открыть Word» и выбрать файл с песнопением 2) Выбрать вкладку Знамя+Слог 3) Нажать кнопку «Создать» 4) Сохранить xml файл 2. Удалить мета-данные из xml-файлы Нужно удалить то, что выделено красным цветом в примере: <?xml version="1.0" standalone="yes"?> <DATAPACKET Version="2.0"> <METADATA> <FIELDS> <FIELD attrname="Id" fieldtype="i4" readonly="true" SUBTYPE="Autoinc" /> <FIELD attrname="Znam" fieldtype="string" WIDTH="10" /> <FIELD attrname="Slog" fieldtype="string" WIDTH="10" /> <FIELD attrname="Stil" fieldtype="string" WIDTH="100" /> <FIELD attrname="VPom" fieldtype="string" WIDTH="10" /> <FIELD attrname="DPom" fieldtype="string" WIDTH="5" /> </FIELDS> <PARAMS AUTOINCVALUE="109" /> </METADATA> <ROWDATA> <ROW … .. /> </ROWDATA> </DATAPACKET>
  • 2. 3. Открыть программу Semantic_Statistik и построить частотные словники Рис.2. Главная форма программы Semantic_Statistik 1) Иногда xml-файлы содержат ошибки кодировки (недопустимые знаки и т.п.). Поэтому, прежде чем начать работу необходимо проверить исходный файл и пересохранить его ( кнопки 1 и 2 на рис.2) 2) Нажать на кнопку «Создать частотный словник» 3) В итоге будет создан документ в программе Word, содержащий частотную таблицу, пример которой показан ниже. В первом столбце записывается «код » знамени, во втором - знамя, в третьем – частоты. «код » знамени знамя частота 76 a 15 121 L 4 77 a 3 89 d 2 -74 A 2 88 d 1 166 b 1 140 Z 1
  • 3. В дальнейшем нам потребуются столбцы, выделенные в примере серым цветом. 4. Открыть Excel – заготовку и найти закон распределения частот знамен Рис.3. Excel лист для поиска закона распределения 1) Заменить частотный словник (Столбцы A и B) 2) Проставить ранги знамен (если у знаменс одинаковой частотой один ранг)
  • 4. � 𝑦 𝑖 = 𝑁 ∗ 𝐶0 + � 𝑥 𝑖 ∗ 𝐶1 + � 𝑥 2 ∗ 𝐶2 3) Составить матрицу для решения системы уравнений: 𝑖 ⎪ � 𝑥 𝑖 𝑦 𝑖 = � 𝑥 𝑖 ∗ 𝐶0 + � 𝑥 2 ∗ 𝐶1 + � 𝑥 3 ∗ 𝐶2 ⎨ 𝑖 𝑖 ⎪� 𝑥 2 𝑦 = � 𝑥 2 ∗ 𝐶 + � 𝑥 3 ∗ 𝐶 + � 𝑥 4 ∗ 𝐶 ⎩ 𝑖 𝑖 𝑖 0 𝑖 1 𝑖 2 𝑦 𝑖 = ln(𝑁 𝑖 /𝑁), 𝑁 𝑖 − частота 𝑖 − го знамени ; 𝑁 − количество знамен в пеcнопении 𝑥 𝑖 = 𝑙𝑛𝑅 𝑖 𝑅 𝑖 − ранг 𝑖 − го знамени i(k,r)/k = p (r+v) –b 2 ∗ 𝐶2 𝑣= 𝐶1 𝑝 = 𝑒 𝐶0 +𝑏∗ln(1+𝑣) 𝑏 = −𝐶1 (1 + 𝑣) 4) Перейти на «Лист2» и найти коэффициенты 𝐶0 , 𝐶1 и 𝐶2 и параметры v, b и p закона Мандельброта: i(k,r) = pk (r+v) -b, где i(k,r) — частота слова в тексте, k — общее число слов в тексте, r — ранг слова 5) Проделать аналогичные вычисления для поиска параметров закона распределения Ципфа: i(k, r) = pk r-b. См. Лист 3 и 4.