SlideShare una empresa de Scribd logo
1 de 18
Бодякин В.И. к.ф.-м.н. с.н.с.
Институт проблем управления РАН
им. В.А. Трапезникова, Москва
E-mail: body@ipu.ru ,
http://www.informograd.narod.ru ,
служ.тел.:334-92-39
(Априорно неопределенной предметной области)
010101010101001001001110110101
010101010101010101010100101010
101010101010101010000010101010
101001010101010101010101001010
100101010101010101010100101010
101010101001010100101010101010
101010010101010100100110101010
101010101010101010101010101010
101010101010100110010101010101
010101010101010101010100101010
101010101010101010010101010101
010100110101010101010101001010
ПОЧЕМУ ВСЕ ОРГАНИЗМЫ "ЕДИНОДУШНЫ"
В КЛАСТЕРИЗАЦИИ ОКРУЖАЮЩЕГО НАС
МИРА НА ОТДЕЛЬНЫЕ ОБРАЗЫ ?
…0100101…
…
0100101…
…
1010010… …0100101…
Предметная область
..1010010…
2
Традиционный способ
структуризации в системах ИИ
t
Информационный
канал
010101010... 01010101..
ПО
aj ak
ai
∆β
01001 – apll
001111 − …
…
00111001 - .
101010 -
Прог-
рамма
ИИ
Програм-
мист
систем ИИ
Предметная
область
3
Предметная область (ПО) – причинно-связанная
совокупность физических процессов.
Процесс – независимое от времени и пространства
детерминированное изменение некоторого
физического параметра во времени.
Любой процесс может быть преобразован в
текстовую форму.
а) б) в) г)
b
⇔
tn
a
⇔
Z
...
⇒⇒
W
t1
t
A
* *
* * * *
*
<kzkkzkb>
текстовая форма
⇒
t2
ln
Wn
многомерный физический процесс <-> текстовая форма
4
Задача:Задача: вв непрерывном потоке ТФнепрерывном потоке ТФ
необходимо выделить образы,необходимо выделить образы,
соответствующие процессам любойсоответствующие процессам любой ПОПО
МАКРИСРИСМАКДУБЛЕН
ϕ
t01 t02 t03
ПО ИС
…
АКР
ИСМ
КД
УБЛ
ЕНД
…
Цель: Минимальный словарь ИС
(гомоморфен процессам
ПО)
Метод:Метод: построение в ИС множествапостроение в ИС множества
различных словарей и выбор минимальногоразличных словарей и выбор минимального
(R(Rii))
Инструментарий:Инструментарий: нейросемантическиенейросемантические
структурыструктуры
R1
МАК
РИС
ЛЕН
ДУБ
5
Демонстрационный примерДемонстрационный пример
(четыре равновероятных процесса формируют непрерывный поток ТФ)(четыре равновероятных процесса формируют непрерывный поток ТФ)
СМАКРИСРИСМАКДУБЛЕН
ИС
____
"Генетич.
программа"
Необходимо построить словарь в N образов, полностью покрывающий
ТФ. Примем что:
Энергетические затраты на обработку одного образа в ИС равна 1Е-.
Время обработки символа и образа − один такт Т,
Энергетические затраты на хранение одного образа в памяти 1/24 Е-.
Энергетика каждого прогнозируемого ИС символа равна 1Е+,
Усредненный на 12 тактов энергетический баланс ИС =
-N(обработка) -1/2N(хранение) + (12-N)(прогнозирование) = (12 - 5/2N)*E
ПО
ДУБ
ЛЕН
РИС
МАК
aj
ai ak
Текстовой поток
Закрашенный
поток
6
Результаты эксперимента
Первая структуризация словаря ИС
Форма словаря: (наибольший размер образа один символ):
 <М><А><К><Р><И><С><Л><Е><Н><Д><У><Б>,
 R(ИС)=12R*(0,5Е-/R) = 6E-,
 прогнозирование (Т) = 0Т (т.к. у образа только один символ),
 затраты энергии на распознавание = 12E-

контролирование потенциальной энергии ТФ = 0E+.
Итог: для односимвольного словаря усредненный энергетический
баланс = 18E- .
Усредненный энергетический баланс ИС назовем
эволюционным потенциалом ИС
7
Вторая структуризация словаря ИС
 а) Минимальная форма словаря:
<МА><К><РИ><С><ЛЕ><Н><ДУ><Б>:
 R(ИС)=8R =4Е-, прогнозирование = 0,5Т (на образ),
 затраты энергии на распознавание = 8E-,
 контролирование потенциальной энергии ТФ = 4E+.
 Итог а) 4Е- + (0,5Т * 8(образов на ТФ=12) = 4E+) + 8E- = 8E- .
 б) Максимальная форма (без полного пересечения):
<МА><КЛ><КР><КД><КМ> <ЛЕ>…<БД>:
 R(ИС)= 20R=10Е-, прогнозирование = 0,2Т (на образ),
 затраты энергии на распознавание = 20E-,
 контролирование потенциальной энергии ТФ = 4E+.
 Итог б) 10Е- + (0,2Т * 20(образов на ТФ=12) = 4E+) + 20E- = 26E- .
 Итоговый лучший эволюционный потенциал = 8E- .
(наибольший размер образа два символа):
8
Третья структуризация словаря
(наибольший размер образа в три символа).
 а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>:
 R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ),
 затраты энергии на распознавание = 4E-,
 контролирование потенциальной энергии ТФ = 8E+.
 Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.
 б) Максимальная форма (без дублирования, т.е. без полного
пересечения): <АКР><ИСР><ИСМ><АКД> <УБЛ><ЕНД> … <АКМ>:
 R(ИС)= 36R=18Е-,
 прогнозирование (Т) = +4E,
 затраты энергии на распознавание = 36E-,
 контролирование потенциальной энергии ТФ = 0E+.
 Итог б) = 50E- .
 Лучший итоговый эволюционный потенциал = 2E+ , 50E- → 2E+(!!).
9
Четвертая структуризация словаря
(наибольший размер образа в четыре символа)
 а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>:
 R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ),
 затраты энергии на распознавание = 4E-,
 контролирование потенциальной энергии ТФ = 8E+.
 Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.
 б) Максимальная форма (без дублирования):
<АКРИ><ИСРИ><ИСМА> <АКДУ><УБЛЕ><ЕНДУ> … <АКМА>:
 R(ИС)= 48R=24Е-, прогнозирование (Т) = 0Т (на образ),
 затраты энергии на распознавание = 48E-,
 контролирование потенциальной энергии ТФ = 0,5E+.
 Итог б) = 78E- .
 Лучший итоговый эволюционный потенциал = 2E+ , 78E- → 2E+
10
Пятая и другие структуризации словаря
Лучший итоговый эволюционный потенциал =
2E+ , 204E- → 2E+
Шестая структуризация словаря, седьмая … и т.д. → 2E+ !!!
Худший - ∞E-
 Теоретический анализ результатов эксперимента
показывает, что эволюционный потенциал ИС
обратно пропорционален размеру словаря,
 Размеры минимальных и максимальных словарей ИС
соотносятся как:
o(N) и o(N3
) !!!
где: N – максимальный размер образа словаря
11
МАКРИСРИСМАКДУБЛЕН…
ϕ
t01 t02 t03
ПО
МАК
РИС
ЛЕН
ДУБ
N
£
АвтоструктуризацияАвтоструктуризация
информацииинформации в ИСв ИС
ИСАКР
ИСР
ИСМ
АКД
УБЛ
ЕНД
…
АКМ
РИС
ДУБ
МАК
ЛЕН
N=4
СN
[L/£]
= N
2+ [L/£]
L=3
o(N3
) >> o(N) !!!
max min
Минимальный
словарь ИС
-----> ! ! !
Образы ИС =
процессам ПО
N2
(L-1)=32
min
max
12
АвтоструктуризацияАвтоструктуризация
иерархических процессовиерархических процессов
ПО …ДА КОЛЯ ЛОВИТ РЫБУ СА… ИС
При минимизации словаря на
нейросемантических структурах,
его топология гомоморфна
структуре исходных процессов
ПО
Подл. Сказ. Обст.
{…}{…}{…}
иерархическая
структура
словарей образов
Подл. Сказ. Обст.
{…}{…}{…}
иерархические
процессы
13
Нейросемантическая форма
представления информации
Предметная область
11011010001101101001-
Алгоритм
НСС
Номера
слоев
6
5
4
3
2
1
0
1 2 3 4 5 6
Номера элементов в слоях
N-элементы
Связи
"0" "1"
Семантика, тексты ПО,
содержание процессов
НСС
Автоматическое выделение образов-процессов из
предметной области в нейроподобные элементы
НСС при минимизации ресурсных затрат (памяти)
N‑элемент (образ НСС) ↔ процесс предметной области
14
Автоструктуризация на
нейросемантических структурах
RИС = f(число N-элементов, число связей)в битах
1/P (компрессия) = --------------------------------------------------------- → 0
при t → ∞ TФИС = объем текстовой информации в ИС в битах
или ∆RИС / ∆TФИС → 0 и ∆RИС → const, при t → M
при t → ∞
Примеры:
а) <RISMAKDUBLENLENDUBMAKMAKLENRISRISLENMAKRISDUBRIS>
правильно выделяются все процессы: <MAK><RIS><MAK><DUB>;
б)<ДОМЗЕБРЫСКИТНАДОМДОМВНАДОМВСКИТВНАСКИТВВЗЕБРЫНАВНА>
правильно выделяются все процессы:<ЗЕБРЫ><СКИТ><ДОМ><НА>
<В>.
двиг алфавита А в кодах ASCII в примере б)
<ЕПНИЖВСЬТЛЙУОБЕПНЕПНГОБЕПНГТЛЙУГОБТЛЙУГЖВСЬОБГОБ> на +
<?IGB@<KVLECMH;?IG?IG=H;?IG=LECM =H;LECM==B<KVH;=H;{> на -133.
15
НСС – это пример 1-го формального преобразования
количественной текстовой формы представления
информации в качественно новую форму –
структуру образов ИС
0
"без учителя"
− "игра"
Авто-
струк-
тури-
зация
log (tn)
(в битах)
"с учителем"
– "школа"
1 —
Критерии достаточности: а) все пространство состояний;
б) если человек может правильно структурировать данный
тексто- вой материал в непривычной, но взаимнооднозначной
нотации,
в) наличие характерных особенностей динамического процесса
при минимизации ресурса RИС
16
По минимальной функции затрат ресурсов ИС Rис
можно объективно определять процессы ПО
Сигнал С С
С Инфор-
мация
И
С И Знание
Автомат "животн." ИС-человек
БШ
ПС
"Телесериал"
Реальный
bsejgr…
abcabc...
Mather…
При TИС = const (t)
ПО
линейная; логарифмическая; const;
функции затрат Rис
f = (RИС (t)) :
t
RИС
t
RИС
t
RИС И
С
Информация – знаковая последовательность на языке системы,
соответствующая целому числу причинно-связанных процессов ПО
…
Определения:
17
Теорема: минимальная форма словаря ИС может достигаться
только при ее изоморфности исходной структуре процессов ПО
Доказательство: Если представить формирование текстовой
формы двумя независимыми и непересекающимися
процессами А и Б, то становится очевидным,
проц. А проц. Б
010010 УКЛОН ЭРМИТАЖ 101010010
образ А образ Б
что минимальным словарем образов закрашивающим эти два
процесса могут быть только образы совпадающие по текстовой
форме с генерирующих их процессами.
На вопрос: "Почему все организмы 'единодушны' в класте-
ризации окружающего нас мира на отдельные образы ?"
Вытекает ответ: "Т.к. минимальный словарь, дает эволюци-
онные преимущества, то все ИС данной ПО выбирают его, а
соответственно, и его образы".
18
ИС
ПО

Más contenido relacionado

Destacado

La Ciudad De México
La Ciudad De MéxicoLa Ciudad De México
La Ciudad De Méxicokarenmullen
 
Caricaturas Nacionales 070610
Caricaturas Nacionales 070610Caricaturas Nacionales 070610
Caricaturas Nacionales 070610carrachote
 
ŻBIK - realizacja w oparciu o platformę mobilną NOTOS
ŻBIK - realizacja w oparciu o platformę mobilną NOTOSŻBIK - realizacja w oparciu o platformę mobilną NOTOS
ŻBIK - realizacja w oparciu o platformę mobilną NOTOSagellner
 
Powerful Eye Shot
Powerful Eye ShotPowerful Eye Shot
Powerful Eye Shotupick
 
Выступление Валерии Прайд на TedMedLiveRussa - 2013
Выступление Валерии Прайд на TedMedLiveRussa - 2013Выступление Валерии Прайд на TedMedLiveRussa - 2013
Выступление Валерии Прайд на TedMedLiveRussa - 2013Danila Medvedev
 
Management in the Russian Transhumanist Movement
Management in the Russian Transhumanist MovementManagement in the Russian Transhumanist Movement
Management in the Russian Transhumanist MovementDanila Medvedev
 
Влияние интеллекта на эволюцию человека
Влияние интеллекта на эволюцию человекаВлияние интеллекта на эволюцию человека
Влияние интеллекта на эволюцию человекаDanila Medvedev
 
1. Состояние и развитие науки и техники в РФ
1. Состояние и развитие науки и техники в РФ1. Состояние и развитие науки и техники в РФ
1. Состояние и развитие науки и техники в РФDanila Medvedev
 
Wymagania Stawiane Systemom Rozliczeniowym z Perspektywy Rozwoju Usług Cyfrowych
Wymagania Stawiane Systemom Rozliczeniowym z Perspektywy Rozwoju Usług CyfrowychWymagania Stawiane Systemom Rozliczeniowym z Perspektywy Rozwoju Usług Cyfrowych
Wymagania Stawiane Systemom Rozliczeniowym z Perspektywy Rozwoju Usług Cyfrowychagellner
 
О проекте журнала Sync
О проекте журнала SyncО проекте журнала Sync
О проекте журнала SyncDanila Medvedev
 
自動外置式心臟去纖顫器 (AED) for CD Unit Training on 28 April 2011
自動外置式心臟去纖顫器 (AED) for CD Unit Training on 28 April 2011自動外置式心臟去纖顫器 (AED) for CD Unit Training on 28 April 2011
自動外置式心臟去纖顫器 (AED) for CD Unit Training on 28 April 2011Raymond Wong
 
心肺復甦法 (CPR) for CD Unit Training on 28 April 2011
心肺復甦法 (CPR) for CD Unit Training on 28 April 2011心肺復甦法 (CPR) for CD Unit Training on 28 April 2011
心肺復甦法 (CPR) for CD Unit Training on 28 April 2011Raymond Wong
 
Legal rights of conscious computers
Legal rights of conscious computersLegal rights of conscious computers
Legal rights of conscious computersDanila Medvedev
 
exotic Asian women
exotic Asian womenexotic Asian women
exotic Asian womenupick
 
Brain Repair and the Near Future of Death
Brain Repair and the Near Future of DeathBrain Repair and the Near Future of Death
Brain Repair and the Near Future of DeathDanila Medvedev
 
IT Governance Concept
IT Governance ConceptIT Governance Concept
IT Governance Conceptitgproduct
 

Destacado (20)

La Ciudad De México
La Ciudad De MéxicoLa Ciudad De México
La Ciudad De México
 
job
jobjob
job
 
Caricaturas Nacionales 070610
Caricaturas Nacionales 070610Caricaturas Nacionales 070610
Caricaturas Nacionales 070610
 
ŻBIK - realizacja w oparciu o platformę mobilną NOTOS
ŻBIK - realizacja w oparciu o platformę mobilną NOTOSŻBIK - realizacja w oparciu o platformę mobilną NOTOS
ŻBIK - realizacja w oparciu o platformę mobilną NOTOS
 
Powerful Eye Shot
Powerful Eye ShotPowerful Eye Shot
Powerful Eye Shot
 
Выступление Валерии Прайд на TedMedLiveRussa - 2013
Выступление Валерии Прайд на TedMedLiveRussa - 2013Выступление Валерии Прайд на TedMedLiveRussa - 2013
Выступление Валерии Прайд на TedMedLiveRussa - 2013
 
Management in the Russian Transhumanist Movement
Management in the Russian Transhumanist MovementManagement in the Russian Transhumanist Movement
Management in the Russian Transhumanist Movement
 
Влияние интеллекта на эволюцию человека
Влияние интеллекта на эволюцию человекаВлияние интеллекта на эволюцию человека
Влияние интеллекта на эволюцию человека
 
KrioRus
KrioRusKrioRus
KrioRus
 
SEO iPhone Apps
SEO iPhone AppsSEO iPhone Apps
SEO iPhone Apps
 
1. Состояние и развитие науки и техники в РФ
1. Состояние и развитие науки и техники в РФ1. Состояние и развитие науки и техники в РФ
1. Состояние и развитие науки и техники в РФ
 
Wymagania Stawiane Systemom Rozliczeniowym z Perspektywy Rozwoju Usług Cyfrowych
Wymagania Stawiane Systemom Rozliczeniowym z Perspektywy Rozwoju Usług CyfrowychWymagania Stawiane Systemom Rozliczeniowym z Perspektywy Rozwoju Usług Cyfrowych
Wymagania Stawiane Systemom Rozliczeniowym z Perspektywy Rozwoju Usług Cyfrowych
 
О проекте журнала Sync
О проекте журнала SyncО проекте журнала Sync
О проекте журнала Sync
 
自動外置式心臟去纖顫器 (AED) for CD Unit Training on 28 April 2011
自動外置式心臟去纖顫器 (AED) for CD Unit Training on 28 April 2011自動外置式心臟去纖顫器 (AED) for CD Unit Training on 28 April 2011
自動外置式心臟去纖顫器 (AED) for CD Unit Training on 28 April 2011
 
心肺復甦法 (CPR) for CD Unit Training on 28 April 2011
心肺復甦法 (CPR) for CD Unit Training on 28 April 2011心肺復甦法 (CPR) for CD Unit Training on 28 April 2011
心肺復甦法 (CPR) for CD Unit Training on 28 April 2011
 
Legal rights of conscious computers
Legal rights of conscious computersLegal rights of conscious computers
Legal rights of conscious computers
 
exotic Asian women
exotic Asian womenexotic Asian women
exotic Asian women
 
Brain Repair and the Near Future of Death
Brain Repair and the Near Future of DeathBrain Repair and the Near Future of Death
Brain Repair and the Near Future of Death
 
Rain Drop
Rain DropRain Drop
Rain Drop
 
IT Governance Concept
IT Governance ConceptIT Governance Concept
IT Governance Concept
 

Similar a Автоструктуризация непрерывного текстового потока

Задворный б.в. (минск) от идеи к исследованию
Задворный б.в. (минск)   от идеи к исследованиюЗадворный б.в. (минск)   от идеи к исследованию
Задворный б.в. (минск) от идеи к исследованиюЛёха Гусев
 
Задворный б.в. (минск) от идеи к исследованию
Задворный б.в. (минск)   от идеи к исследованиюЗадворный б.в. (минск)   от идеи к исследованию
Задворный б.в. (минск) от идеи к исследованиюЛёха Гусев
 
Презентация на тему: Повторение курса информатики 7 класс
Презентация на тему: Повторение курса информатики 7 классПрезентация на тему: Повторение курса информатики 7 класс
Презентация на тему: Повторение курса информатики 7 класс2berkas
 
Алгоритмы и структуры данных осень 2013 лекция 1
Алгоритмы и структуры данных осень 2013 лекция 1Алгоритмы и структуры данных осень 2013 лекция 1
Алгоритмы и структуры данных осень 2013 лекция 1Technopark
 
чернякова г.в.
чернякова г.в.чернякова г.в.
чернякова г.в.sharikdp
 
Поиск ошибок в программах на языке C#
Поиск ошибок в программах на языке C#Поиск ошибок в программах на языке C#
Поиск ошибок в программах на языке C#Mikhail Shcherbakov
 
На что способны современные статические анализаторы для C#
На что способны современные статические анализаторы для C#На что способны современные статические анализаторы для C#
На что способны современные статические анализаторы для C#Artem Borzilov
 
Презентация "Методы и алгоритмы распознавания образов с использованием древо...
Презентация "Методы и алгоритмы распознавания образов  с использованием древо...Презентация "Методы и алгоритмы распознавания образов  с использованием древо...
Презентация "Методы и алгоритмы распознавания образов с использованием древо...ph.d. Dmitry Stepanov
 
Представление графов в памяти компьютера (c++).
Представление графов в памяти компьютера (c++).Представление графов в памяти компьютера (c++).
Представление графов в памяти компьютера (c++).Olga Maksimenkova
 
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014Python Meetup
 
1742 повторяем математику за курс средней школы арефьева и.г-2015 -118с
1742  повторяем математику за курс средней школы арефьева и.г-2015 -118с1742  повторяем математику за курс средней школы арефьева и.г-2015 -118с
1742 повторяем математику за курс средней школы арефьева и.г-2015 -118сpsvayy
 
повторение 7кл. алгебра
повторение 7кл. алгебраповторение 7кл. алгебра
повторение 7кл. алгебраLyudmila Yefremova
 

Similar a Автоструктуризация непрерывного текстового потока (15)

10 a k
10 a k10 a k
10 a k
 
Задворный б.в. (минск) от идеи к исследованию
Задворный б.в. (минск)   от идеи к исследованиюЗадворный б.в. (минск)   от идеи к исследованию
Задворный б.в. (минск) от идеи к исследованию
 
Задворный б.в. (минск) от идеи к исследованию
Задворный б.в. (минск)   от идеи к исследованиюЗадворный б.в. (минск)   от идеи к исследованию
Задворный б.в. (минск) от идеи к исследованию
 
Презентация на тему: Повторение курса информатики 7 класс
Презентация на тему: Повторение курса информатики 7 классПрезентация на тему: Повторение курса информатики 7 класс
Презентация на тему: Повторение курса информатики 7 класс
 
Алгоритмы и структуры данных осень 2013 лекция 1
Алгоритмы и структуры данных осень 2013 лекция 1Алгоритмы и структуры данных осень 2013 лекция 1
Алгоритмы и структуры данных осень 2013 лекция 1
 
8 a a_2012
8 a a_20128 a a_2012
8 a a_2012
 
чернякова г.в.
чернякова г.в.чернякова г.в.
чернякова г.в.
 
Поиск ошибок в программах на языке C#
Поиск ошибок в программах на языке C#Поиск ошибок в программах на языке C#
Поиск ошибок в программах на языке C#
 
На что способны современные статические анализаторы для C#
На что способны современные статические анализаторы для C#На что способны современные статические анализаторы для C#
На что способны современные статические анализаторы для C#
 
Презентация "Методы и алгоритмы распознавания образов с использованием древо...
Презентация "Методы и алгоритмы распознавания образов  с использованием древо...Презентация "Методы и алгоритмы распознавания образов  с использованием древо...
Презентация "Методы и алгоритмы распознавания образов с использованием древо...
 
01 вводная
01 вводная01 вводная
01 вводная
 
Представление графов в памяти компьютера (c++).
Представление графов в памяти компьютера (c++).Представление графов в памяти компьютера (c++).
Представление графов в памяти компьютера (c++).
 
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014
 
1742 повторяем математику за курс средней школы арефьева и.г-2015 -118с
1742  повторяем математику за курс средней школы арефьева и.г-2015 -118с1742  повторяем математику за курс средней школы арефьева и.г-2015 -118с
1742 повторяем математику за курс средней школы арефьева и.г-2015 -118с
 
повторение 7кл. алгебра
повторение 7кл. алгебраповторение 7кл. алгебра
повторение 7кл. алгебра
 

Más de Danila Medvedev

The remembrance of the resurrectables (2015) (1)
The remembrance of the resurrectables (2015) (1)The remembrance of the resurrectables (2015) (1)
The remembrance of the resurrectables (2015) (1)Danila Medvedev
 
Продление жизни в мегаполисе
Продление жизни в мегаполисеПродление жизни в мегаполисе
Продление жизни в мегаполисеDanila Medvedev
 
Утопология - как построить трансгуманистическую утопию
 Утопология - как построить трансгуманистическую утопию Утопология - как построить трансгуманистическую утопию
Утопология - как построить трансгуманистическую утопиюDanila Medvedev
 
Антиклерикальная стратегия
Антиклерикальная стратегияАнтиклерикальная стратегия
Антиклерикальная стратегияDanila Medvedev
 
Создание альтернативных идеологических техноэкосистем
Создание альтернативных идеологических техноэкосистемСоздание альтернативных идеологических техноэкосистем
Создание альтернативных идеологических техноэкосистемDanila Medvedev
 
будущее транспорта
будущее транспортабудущее транспорта
будущее транспортаDanila Medvedev
 
форсайт оп презентация медведев
форсайт оп презентация медведевфорсайт оп презентация медведев
форсайт оп презентация медведевDanila Medvedev
 
Москва-2015: город без пробок
Москва-2015: город без пробокМосква-2015: город без пробок
Москва-2015: город без пробокDanila Medvedev
 
Системная схема старения человека
Системная схема старения человекаСистемная схема старения человека
Системная схема старения человекаDanila Medvedev
 
Human Aging System Diagram
Human Aging System DiagramHuman Aging System Diagram
Human Aging System DiagramDanila Medvedev
 
Проблемы практического принятия решений
Проблемы практического принятия решенийПроблемы практического принятия решений
Проблемы практического принятия решенийDanila Medvedev
 
Новости науки 23
Новости науки 23Новости науки 23
Новости науки 23Danila Medvedev
 
Системная схема старения человека
Системная схема старения человекаСистемная схема старения человека
Системная схема старения человекаDanila Medvedev
 
Проблемы практического принятия решений
Проблемы практического принятия решенийПроблемы практического принятия решений
Проблемы практического принятия решенийDanila Medvedev
 
6. Применение Интернета в распространении научно-популярных знаний
6. Применение Интернета в распространении научно-популярных знаний6. Применение Интернета в распространении научно-популярных знаний
6. Применение Интернета в распространении научно-популярных знанийDanila Medvedev
 
5. Государственный бюджет и иные источники средств на популяризацию науки
5. Государственный бюджет и иные источники средств на популяризацию науки5. Государственный бюджет и иные источники средств на популяризацию науки
5. Государственный бюджет и иные источники средств на популяризацию наукиDanila Medvedev
 
4. Пропаганда, распространение научно-популярных знаний
4. Пропаганда, распространение научно-популярных знаний 4. Пропаганда, распространение научно-популярных знаний
4. Пропаганда, распространение научно-популярных знаний Danila Medvedev
 
3. Успешные примеры пропаганды и популяризации науки
3. Успешные примеры пропаганды и популяризации науки3. Успешные примеры пропаганды и популяризации науки
3. Успешные примеры пропаганды и популяризации наукиDanila Medvedev
 
2. Методы и пути пропаганды и распространения научных и технических знаний
2. Методы и пути пропаганды и распространения научных и технических знаний2. Методы и пути пропаганды и распространения научных и технических знаний
2. Методы и пути пропаганды и распространения научных и технических знанийDanila Medvedev
 

Más de Danila Medvedev (20)

The remembrance of the resurrectables (2015) (1)
The remembrance of the resurrectables (2015) (1)The remembrance of the resurrectables (2015) (1)
The remembrance of the resurrectables (2015) (1)
 
Продление жизни в мегаполисе
Продление жизни в мегаполисеПродление жизни в мегаполисе
Продление жизни в мегаполисе
 
Утопология - как построить трансгуманистическую утопию
 Утопология - как построить трансгуманистическую утопию Утопология - как построить трансгуманистическую утопию
Утопология - как построить трансгуманистическую утопию
 
Антиклерикальная стратегия
Антиклерикальная стратегияАнтиклерикальная стратегия
Антиклерикальная стратегия
 
Создание альтернативных идеологических техноэкосистем
Создание альтернативных идеологических техноэкосистемСоздание альтернативных идеологических техноэкосистем
Создание альтернативных идеологических техноэкосистем
 
будущее транспорта
будущее транспортабудущее транспорта
будущее транспорта
 
форсайт оп презентация медведев
форсайт оп презентация медведевфорсайт оп презентация медведев
форсайт оп презентация медведев
 
Москва-2015: город без пробок
Москва-2015: город без пробокМосква-2015: город без пробок
Москва-2015: город без пробок
 
Системная схема старения человека
Системная схема старения человекаСистемная схема старения человека
Системная схема старения человека
 
Krio rus imminst
Krio rus imminstKrio rus imminst
Krio rus imminst
 
Human Aging System Diagram
Human Aging System DiagramHuman Aging System Diagram
Human Aging System Diagram
 
Проблемы практического принятия решений
Проблемы практического принятия решенийПроблемы практического принятия решений
Проблемы практического принятия решений
 
Новости науки 23
Новости науки 23Новости науки 23
Новости науки 23
 
Системная схема старения человека
Системная схема старения человекаСистемная схема старения человека
Системная схема старения человека
 
Проблемы практического принятия решений
Проблемы практического принятия решенийПроблемы практического принятия решений
Проблемы практического принятия решений
 
6. Применение Интернета в распространении научно-популярных знаний
6. Применение Интернета в распространении научно-популярных знаний6. Применение Интернета в распространении научно-популярных знаний
6. Применение Интернета в распространении научно-популярных знаний
 
5. Государственный бюджет и иные источники средств на популяризацию науки
5. Государственный бюджет и иные источники средств на популяризацию науки5. Государственный бюджет и иные источники средств на популяризацию науки
5. Государственный бюджет и иные источники средств на популяризацию науки
 
4. Пропаганда, распространение научно-популярных знаний
4. Пропаганда, распространение научно-популярных знаний 4. Пропаганда, распространение научно-популярных знаний
4. Пропаганда, распространение научно-популярных знаний
 
3. Успешные примеры пропаганды и популяризации науки
3. Успешные примеры пропаганды и популяризации науки3. Успешные примеры пропаганды и популяризации науки
3. Успешные примеры пропаганды и популяризации науки
 
2. Методы и пути пропаганды и распространения научных и технических знаний
2. Методы и пути пропаганды и распространения научных и технических знаний2. Методы и пути пропаганды и распространения научных и технических знаний
2. Методы и пути пропаганды и распространения научных и технических знаний
 

Автоструктуризация непрерывного текстового потока

  • 1. Бодякин В.И. к.ф.-м.н. с.н.с. Институт проблем управления РАН им. В.А. Трапезникова, Москва E-mail: body@ipu.ru , http://www.informograd.narod.ru , служ.тел.:334-92-39 (Априорно неопределенной предметной области)
  • 3. Традиционный способ структуризации в системах ИИ t Информационный канал 010101010... 01010101.. ПО aj ak ai ∆β 01001 – apll 001111 − … … 00111001 - . 101010 - Прог- рамма ИИ Програм- мист систем ИИ Предметная область 3
  • 4. Предметная область (ПО) – причинно-связанная совокупность физических процессов. Процесс – независимое от времени и пространства детерминированное изменение некоторого физического параметра во времени. Любой процесс может быть преобразован в текстовую форму. а) б) в) г) b ⇔ tn a ⇔ Z ... ⇒⇒ W t1 t A * * * * * * * <kzkkzkb> текстовая форма ⇒ t2 ln Wn многомерный физический процесс <-> текстовая форма 4
  • 5. Задача:Задача: вв непрерывном потоке ТФнепрерывном потоке ТФ необходимо выделить образы,необходимо выделить образы, соответствующие процессам любойсоответствующие процессам любой ПОПО МАКРИСРИСМАКДУБЛЕН ϕ t01 t02 t03 ПО ИС … АКР ИСМ КД УБЛ ЕНД … Цель: Минимальный словарь ИС (гомоморфен процессам ПО) Метод:Метод: построение в ИС множествапостроение в ИС множества различных словарей и выбор минимальногоразличных словарей и выбор минимального (R(Rii)) Инструментарий:Инструментарий: нейросемантическиенейросемантические структурыструктуры R1 МАК РИС ЛЕН ДУБ 5
  • 6. Демонстрационный примерДемонстрационный пример (четыре равновероятных процесса формируют непрерывный поток ТФ)(четыре равновероятных процесса формируют непрерывный поток ТФ) СМАКРИСРИСМАКДУБЛЕН ИС ____ "Генетич. программа" Необходимо построить словарь в N образов, полностью покрывающий ТФ. Примем что: Энергетические затраты на обработку одного образа в ИС равна 1Е-. Время обработки символа и образа − один такт Т, Энергетические затраты на хранение одного образа в памяти 1/24 Е-. Энергетика каждого прогнозируемого ИС символа равна 1Е+, Усредненный на 12 тактов энергетический баланс ИС = -N(обработка) -1/2N(хранение) + (12-N)(прогнозирование) = (12 - 5/2N)*E ПО ДУБ ЛЕН РИС МАК aj ai ak Текстовой поток Закрашенный поток 6
  • 7. Результаты эксперимента Первая структуризация словаря ИС Форма словаря: (наибольший размер образа один символ):  <М><А><К><Р><И><С><Л><Е><Н><Д><У><Б>,  R(ИС)=12R*(0,5Е-/R) = 6E-,  прогнозирование (Т) = 0Т (т.к. у образа только один символ),  затраты энергии на распознавание = 12E-  контролирование потенциальной энергии ТФ = 0E+. Итог: для односимвольного словаря усредненный энергетический баланс = 18E- . Усредненный энергетический баланс ИС назовем эволюционным потенциалом ИС 7
  • 8. Вторая структуризация словаря ИС  а) Минимальная форма словаря: <МА><К><РИ><С><ЛЕ><Н><ДУ><Б>:  R(ИС)=8R =4Е-, прогнозирование = 0,5Т (на образ),  затраты энергии на распознавание = 8E-,  контролирование потенциальной энергии ТФ = 4E+.  Итог а) 4Е- + (0,5Т * 8(образов на ТФ=12) = 4E+) + 8E- = 8E- .  б) Максимальная форма (без полного пересечения): <МА><КЛ><КР><КД><КМ> <ЛЕ>…<БД>:  R(ИС)= 20R=10Е-, прогнозирование = 0,2Т (на образ),  затраты энергии на распознавание = 20E-,  контролирование потенциальной энергии ТФ = 4E+.  Итог б) 10Е- + (0,2Т * 20(образов на ТФ=12) = 4E+) + 20E- = 26E- .  Итоговый лучший эволюционный потенциал = 8E- . (наибольший размер образа два символа): 8
  • 9. Третья структуризация словаря (наибольший размер образа в три символа).  а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>:  R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ),  затраты энергии на распознавание = 4E-,  контролирование потенциальной энергии ТФ = 8E+.  Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.  б) Максимальная форма (без дублирования, т.е. без полного пересечения): <АКР><ИСР><ИСМ><АКД> <УБЛ><ЕНД> … <АКМ>:  R(ИС)= 36R=18Е-,  прогнозирование (Т) = +4E,  затраты энергии на распознавание = 36E-,  контролирование потенциальной энергии ТФ = 0E+.  Итог б) = 50E- .  Лучший итоговый эволюционный потенциал = 2E+ , 50E- → 2E+(!!). 9
  • 10. Четвертая структуризация словаря (наибольший размер образа в четыре символа)  а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>:  R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ),  затраты энергии на распознавание = 4E-,  контролирование потенциальной энергии ТФ = 8E+.  Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.  б) Максимальная форма (без дублирования): <АКРИ><ИСРИ><ИСМА> <АКДУ><УБЛЕ><ЕНДУ> … <АКМА>:  R(ИС)= 48R=24Е-, прогнозирование (Т) = 0Т (на образ),  затраты энергии на распознавание = 48E-,  контролирование потенциальной энергии ТФ = 0,5E+.  Итог б) = 78E- .  Лучший итоговый эволюционный потенциал = 2E+ , 78E- → 2E+ 10
  • 11. Пятая и другие структуризации словаря Лучший итоговый эволюционный потенциал = 2E+ , 204E- → 2E+ Шестая структуризация словаря, седьмая … и т.д. → 2E+ !!! Худший - ∞E-  Теоретический анализ результатов эксперимента показывает, что эволюционный потенциал ИС обратно пропорционален размеру словаря,  Размеры минимальных и максимальных словарей ИС соотносятся как: o(N) и o(N3 ) !!! где: N – максимальный размер образа словаря 11
  • 12. МАКРИСРИСМАКДУБЛЕН… ϕ t01 t02 t03 ПО МАК РИС ЛЕН ДУБ N £ АвтоструктуризацияАвтоструктуризация информацииинформации в ИСв ИС ИСАКР ИСР ИСМ АКД УБЛ ЕНД … АКМ РИС ДУБ МАК ЛЕН N=4 СN [L/£] = N 2+ [L/£] L=3 o(N3 ) >> o(N) !!! max min Минимальный словарь ИС -----> ! ! ! Образы ИС = процессам ПО N2 (L-1)=32 min max 12
  • 13. АвтоструктуризацияАвтоструктуризация иерархических процессовиерархических процессов ПО …ДА КОЛЯ ЛОВИТ РЫБУ СА… ИС При минимизации словаря на нейросемантических структурах, его топология гомоморфна структуре исходных процессов ПО Подл. Сказ. Обст. {…}{…}{…} иерархическая структура словарей образов Подл. Сказ. Обст. {…}{…}{…} иерархические процессы 13
  • 14. Нейросемантическая форма представления информации Предметная область 11011010001101101001- Алгоритм НСС Номера слоев 6 5 4 3 2 1 0 1 2 3 4 5 6 Номера элементов в слоях N-элементы Связи "0" "1" Семантика, тексты ПО, содержание процессов НСС Автоматическое выделение образов-процессов из предметной области в нейроподобные элементы НСС при минимизации ресурсных затрат (памяти) N‑элемент (образ НСС) ↔ процесс предметной области 14
  • 15. Автоструктуризация на нейросемантических структурах RИС = f(число N-элементов, число связей)в битах 1/P (компрессия) = --------------------------------------------------------- → 0 при t → ∞ TФИС = объем текстовой информации в ИС в битах или ∆RИС / ∆TФИС → 0 и ∆RИС → const, при t → M при t → ∞ Примеры: а) <RISMAKDUBLENLENDUBMAKMAKLENRISRISLENMAKRISDUBRIS> правильно выделяются все процессы: <MAK><RIS><MAK><DUB>; б)<ДОМЗЕБРЫСКИТНАДОМДОМВНАДОМВСКИТВНАСКИТВВЗЕБРЫНАВНА> правильно выделяются все процессы:<ЗЕБРЫ><СКИТ><ДОМ><НА> <В>. двиг алфавита А в кодах ASCII в примере б) <ЕПНИЖВСЬТЛЙУОБЕПНЕПНГОБЕПНГТЛЙУГОБТЛЙУГЖВСЬОБГОБ> на + <?IGB@<KVLECMH;?IG?IG=H;?IG=LECM =H;LECM==B<KVH;=H;{> на -133. 15
  • 16. НСС – это пример 1-го формального преобразования количественной текстовой формы представления информации в качественно новую форму – структуру образов ИС 0 "без учителя" − "игра" Авто- струк- тури- зация log (tn) (в битах) "с учителем" – "школа" 1 — Критерии достаточности: а) все пространство состояний; б) если человек может правильно структурировать данный тексто- вой материал в непривычной, но взаимнооднозначной нотации, в) наличие характерных особенностей динамического процесса при минимизации ресурса RИС 16
  • 17. По минимальной функции затрат ресурсов ИС Rис можно объективно определять процессы ПО Сигнал С С С Инфор- мация И С И Знание Автомат "животн." ИС-человек БШ ПС "Телесериал" Реальный bsejgr… abcabc... Mather… При TИС = const (t) ПО линейная; логарифмическая; const; функции затрат Rис f = (RИС (t)) : t RИС t RИС t RИС И С Информация – знаковая последовательность на языке системы, соответствующая целому числу причинно-связанных процессов ПО … Определения: 17
  • 18. Теорема: минимальная форма словаря ИС может достигаться только при ее изоморфности исходной структуре процессов ПО Доказательство: Если представить формирование текстовой формы двумя независимыми и непересекающимися процессами А и Б, то становится очевидным, проц. А проц. Б 010010 УКЛОН ЭРМИТАЖ 101010010 образ А образ Б что минимальным словарем образов закрашивающим эти два процесса могут быть только образы совпадающие по текстовой форме с генерирующих их процессами. На вопрос: "Почему все организмы 'единодушны' в класте- ризации окружающего нас мира на отдельные образы ?" Вытекает ответ: "Т.к. минимальный словарь, дает эволюци- онные преимущества, то все ИС данной ПО выбирают его, а соответственно, и его образы". 18 ИС ПО

Notas del editor

  1. Более полувековые попытки построения полноценного искусственного интеллекта, свидетельствуют о неадекватности используемых методов для решения поставленной проблеме. Говоря о материи и сознании как эволюционно родственных компонентах и принимая материалистическую точку зрения, можно предложить конструктивную программу построения искусственного разума, опираясь на только физические характеристики.
  2. В качестве первого шага рассмотрим комплекс: &amp;quot;Предметная область  Информационный канал  Информационная система&amp;quot;. Ни одна из этих составляющих до сегодняшнего дня не имеет четкого физического описания в: сантиметрах, битах, секундах.
  3. Будем рассматривать любую физическую ПО как некоторую дискретную пространственно-временную область с взаимодействующими объектами (ai, aj,). При попадании нескольких объектов, в область взаимодействия происходит процесс их взаимодействия.
  4. НСС – это многодольный ориентированный граф, в вершинах которого находятся нейроподобные N‑элементы, отражающие объекты-процессы предметной области. В результате действия НСС-алгоритма, исходный линейный информационный поток преобразуется в гипертекстовый граф, в вершинах которого автоматически выделяются объекты и процессы данной предметной области, а дуги задают причинно-следственные связи этих процессов. Данный граф дает исследователю полную (структурную) картину процессов исследуемой предметной области. Исследования показали, что представление произвольного текстового потока в форме НСС, помимо рассмотренной автоструктуризации дает множество преимуществ: произвольный ассоциативный и параллельный доступ; автоструктуризацию (N‑элемент  образ), монотонно растущую компрессию, повышенную надежность, независимость времени доступа от объема хранимой информации, самопрограммируемость входящей информацией и др.
  5. На приведенных примерах виден результат, как из произвольной непрерывной ТФ НСС автоматически выделяет исходные ЭСЕ. Человек эту же задачу решает на несколько порядков медленнее
  6. Качество динамика процесса автоструктуризации любой семантически нагруженной ПО отображается подобным графиком. Характерно, что если НСС подсказывают часть ЭСЕ, то процесс сходимости (т.е. выявление всех ЭСЕ) существенно ускоряется. И при достаточности представительности ТФ, достигается полная автоструктуризация.