This is the slide deck of lectures "Predictive Analytic Basics".The Base and Machine Learning Technic using R scripts is presented. The slides can be useful for Russian language students. The slides serve the part one of the lectures. Next part will be uploaded soon.
10. Объем (размер) данных
Название Размер по ГОСТ 8.417-2002 (приставки по
СИ)
Символ Примечание: размер по
стандартам МЭК
байт 8 бит B
килобайт 103 B КB 210 =1024 байт
мегабайт 106 B МB 220 байт
гигабайт 109 B GB 230 байт
терабайт 1012 B ТБ 240 байт
петабайт 1015 B PB 250 байт
эксабайт 1018 B EB 260 байт
зеттабайт 1021 B ZB 270 байт
йоттабайт 1024 B YB 280 байт
Vladimir Krylov 2014 10
21. Консолидация - техники
• Очистка данных:
пропущенные значения
дубликаты данных
шумы и выбросы
• Интеграция данных
стандарт XML
стандарт ISO 15926
JSON
Vladimir Krylov 2014 21
68. CRAN - Comprehensive R Archive Network
• Байесовский интерфейс
• Хемометрия и вычислительная физика
• Анализ, мониторинг и проектирование клинического исслеования
• Кластерный анализ и конечноэлементные модели
• Дифференциальные уравнения
• Вероятностные распределения
• Вычислительная эконометрика
• Анализ экологических и данных и данных об окружающей среде
• Планирование экспериментов и анализ экспериментальных данных
• Эмпирические финансы
• Статистическая генетика
• Графическое отображение, динамическая графика и визуализация
• Высокопроизводительны е и параллельные вычисления на R
• Машинное обучение и статистическое обучение (Machine learning&Statistical
Learning) Анализ медицинских изображений
• Мета-анализ
• Мультивариантная статистика
• Обработка естественного языка (Natural language Processing)
• Численная математика
• Официальная статистика и методология опросов
• Оптимизация и математическое программирование
• Анализ данных фармокинетики
• Филогенетика и особые сравнительные методы (Phylogenetics, Espeially
Comprative Methods)
• Психометрические модели и методы
• Исследования репродуцирования (Reproducible Research)
• Робастные статистические методы
• Статистика социальных исследований
• Анализ пространственных данных
• Управление и анализ пространственно-временных данных (Handling and
Analyzing Spatio-Temporal Data)
• Анализ наблюдений (Survival Analysis)
• Анализ временных рядов
• Web технологии и сервисы
• Графические модели в R (gRaphical Models in R)
Vladimir Krylov 2014 68