SlideShare una empresa de Scribd logo
1 de 26
Путь питониста,
или
Как мы перезапускали открытые
данные в России
25 марта 2017 года, Вологда
Пятая конференция разработчиков ПО «DevParty»
Елена Никитина
Аналитический центр при Правительстве РФ
Открытые данные:
что это, зачем они и где их взять?
Data Mining…
(Data Parsing, Data Scraping…)
Open data:
свобода доступа, свобода
использования, машиночитаемость
(исходник картинки с Локо-Банк)(картинка с http://cu-status.com.ua)
VS
• Не нужно лишней работы - данные уже кем-то подготовлены за вас
• Всегда в одном месте (обычно домен/opendata)
• Их кто-то хранит за вас (вместе с предыдущими версиями)
• Сами обновляются
• Совсем идеальный случай – данные связаны между собой (LOD)
• Просто берете и используете, бесплатно, без соглашений и ограничений…
• … качаете 10 Гб без ограничения скорости. Не то что на файлообменниках 3
Torgi.gov.ru – государственный сайт для проведения торгов
Проект Земельные торги России – удобный и простой доступ к торгам
Проект Земельные торги России – инициатива, которая что-то меняет
Проект Российские школы
Проект Российские школы
Проект Российские школы
Проект Российские школы – мотивирует открывать данные
11
Кто выкладывает Где выкладывает
Федеральные, региональные,
муниципальные ОГВ
сайт/opendata. Например, минобрнауки.рф/opendata
Подведомственные
организации федеральных
ОГВ
сайт/opendata. Например, obrnadzor.gov.ru/opendata
Все те же самые На федеральном портале data.gov.ru
Все те же самые На отдельных порталах
Например, opendata.mon.gov.ru, opendata.gov35.ru
Все те же самые и кто угодно
через API
http://api.duma.gov.ru
Кто угодно на ftp ftp://free:free@ftp.zakupki.gov.ru,
ftp://gmuext:YctTa34AdOPyld2@ftp.bus.gov.ru
Кто угодно где угодно На своем портале: hubofdata.ru, kaggle.com
Где взять открытые данные?
Kaggle / ЗАДАЧИ + РЕШЕНИЯ + ДАННЫЕ. ОТКРЫТЫЕ ДАННЫЕ
‘Your Home for Data Science’
https://www.kaggle.com/Открытые данные в России 12
Как мы перезапускали
открытые данные в России
2015 год: начало
14
• Федеральный портал открытых данных: менее 3 000 наборов данных плохого
качества ни о чем (большая часть которых не обновлялась с 2013 г).
• Программисты не знают, что такое открытые данные. И даже не спрашивают,
что это такое.
• Госорганы боятся программистов…
• …и тоже не знают, что такое открытые данные.
• Госорганы не хотят связываться с открытием новых данных.
2017 год: начало
• Федеральный портал открытых данных: почти 13 000 наборов данных, среди
них появились интересные обновляющиеся данные.
• Программисты начинают спрашивать, где взять открытые данные. И уже
перестали спрашивать, что это такое.
• Госорганы вживую встречаются с программистами на хакатонах…
• …и потихоньку начинают разбираться в своих собственных открытых данных.
• Госорганы начинают открывать данные по своей инициативе.
Какие мероприятия мы сделали за 2 года
15
• 4 хакатона Data.gov.ru Hackathon 2015-2016 гг. Последние – за 100 человек
участников. Бюджет – еда. Призы начали давать партнеры, начиная со
второго хакатона.
• Первый Всероссийский конкурс «Открытые данные Российской Федерации»
сентябрь-ноябрь 2015 г. Подано около 100 заявок. Бюджет: 0 рублей.
Госфинансирование: 0 рублей.
• Первый Общероссийский саммит по открытым данным декабрь 2015 г.
Бюджет 4,5 млн от привлеченных партнеров. Около 600 участников.
Госфинансирование: 0 рублей.
• Open Data Bootcamp – 2-месячный интенсив по обучению созданию стартапов
на открытых данных октябрь-ноябрь 2016 г. Подано 32 заявки, количество
участников: 15. Один из проектов, HouseScan, успешно развивается и
использует открытые данные. Бюджет: 0 рублей. Госфинансирование: 0
рублей. Участие: бесплатное.
• Семинары и вебинары для госорганов. Рекорд – больше 700 (!) человек на
вебинаре по открытым данным для региональных органов власти в 2016 г.
Выступления на митапах и конференциях и пр.
Федеральный портал data.gov.ru. Просто чтобы вы знали, что он есть
16
Открытые данные:
как Си-шник превратился в питониста
благодаря интересному проекту
Проект Декларатор – единственное в России место, где уцелели все данные о
доходах чиновников за много лет
18
Проект Декларатор – единственное в России место, где уцелели все данные о
доходах чиновников за много лет
19
Проект Декларатор: проблема в исходных данных
20
DOC, XLS, PDF…
Проект Декларатор: все еще на C#
21
Как поговорить с Moscow Python о менторах на хакатон…
и внезапно выступить на митапе
22
МК по парсингу данных… на Python (Нетология)
23
24
МК по парсингу данных… на Python (Нетология) – пруф 
https://vimeo.com/200793648
25
МК по парсингу данных… на Python (Нетология) – пруф 
БЛАГОДАРЮ ЗА ВНИМАНИЕ
Елена Никитина
Открытые данные в России
fb.com/OpenDataInRussia
e.nikitina@ac.gov.ru
fb.com/Shorstko

Más contenido relacionado

La actualidad más candente

Журналистика данных в СМИ и обществе
Журналистика данных  в СМИ и обществеЖурналистика данных  в СМИ и обществе
Журналистика данных в СМИ и обществеKrystsina Shveda
 
Who are the 36 thousands employees of the russian defence ministry (in rus) ...
Who are the 36 thousands employees of the russian defence ministry (in rus)  ...Who are the 36 thousands employees of the russian defence ministry (in rus)  ...
Who are the 36 thousands employees of the russian defence ministry (in rus) ...DataFest Tbilisi
 
Анализ поисковых запросов с помощью R
Анализ поисковых запросов с помощью RАнализ поисковых запросов с помощью R
Анализ поисковых запросов с помощью RAristos
 
Качество открытых государственных геоданных
Качество открытых государственных геоданныхКачество открытых государственных геоданных
Качество открытых государственных геоданныхMaxim Dubinin
 
Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Ivan Begtin
 
Как достать машиночитаемые государственные данные, которых, вроде бы, нет
Как достать машиночитаемые государственные данные, которых, вроде бы, нетКак достать машиночитаемые государственные данные, которых, вроде бы, нет
Как достать машиночитаемые государственные данные, которых, вроде бы, нетElena Nikitina
 
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.ushchent
 
Открытые данные
Открытые данныеОткрытые данные
Открытые данныеushchent
 
Открытые данные на Drupal-слёте
Открытые данные на Drupal-слётеОткрытые данные на Drupal-слёте
Открытые данные на Drupal-слётеzabej
 
7 рекомендаций региональным агентствам
7 рекомендаций региональным агентствам7 рекомендаций региональным агентствам
7 рекомендаций региональным агентствамГеннадий Метёлкин
 
Бизнес модели на открытых данных
Бизнес модели на открытых данныхБизнес модели на открытых данных
Бизнес модели на открытых данныхIvan Begtin
 
Язык R в маркетинге и бизнесе
Язык R в маркетинге и бизнесеЯзык R в маркетинге и бизнесе
Язык R в маркетинге и бизнесеNetpeak
 
Технологии Semantic Web. Часть I. Введение
Технологии Semantic Web. Часть I. ВведениеТехнологии Semantic Web. Часть I. Введение
Технологии Semantic Web. Часть I. ВведениеAlik Kirillovich
 
Поиск_Яндекса: год_спустя
Поиск_Яндекса: год_спустяПоиск_Яндекса: год_спустя
Поиск_Яндекса: год_спустяYandex
 

La actualidad más candente (17)

Журналистика данных в СМИ и обществе
Журналистика данных  в СМИ и обществеЖурналистика данных  в СМИ и обществе
Журналистика данных в СМИ и обществе
 
Who are the 36 thousands employees of the russian defence ministry (in rus) ...
Who are the 36 thousands employees of the russian defence ministry (in rus)  ...Who are the 36 thousands employees of the russian defence ministry (in rus)  ...
Who are the 36 thousands employees of the russian defence ministry (in rus) ...
 
Анализ поисковых запросов с помощью R
Анализ поисковых запросов с помощью RАнализ поисковых запросов с помощью R
Анализ поисковых запросов с помощью R
 
Качество открытых государственных геоданных
Качество открытых государственных геоданныхКачество открытых государственных геоданных
Качество открытых государственных геоданных
 
Open Data
Open DataOpen Data
Open Data
 
Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Где взять данные дата-журналисту?
Где взять данные дата-журналисту?
 
Как достать машиночитаемые государственные данные, которых, вроде бы, нет
Как достать машиночитаемые государственные данные, которых, вроде бы, нетКак достать машиночитаемые государственные данные, которых, вроде бы, нет
Как достать машиночитаемые государственные данные, которых, вроде бы, нет
 
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
 
Открытые данные
Открытые данныеОткрытые данные
Открытые данные
 
Открытые данные на Drupal-слёте
Открытые данные на Drupal-слётеОткрытые данные на Drupal-слёте
Открытые данные на Drupal-слёте
 
7 рекомендаций региональным агентствам
7 рекомендаций региональным агентствам7 рекомендаций региональным агентствам
7 рекомендаций региональным агентствам
 
Бизнес модели на открытых данных
Бизнес модели на открытых данныхБизнес модели на открытых данных
Бизнес модели на открытых данных
 
KL10TCH.School : Введение в Linked Data и Semantic Web
KL10TCH.School : Введение в Linked Data и Semantic WebKL10TCH.School : Введение в Linked Data и Semantic Web
KL10TCH.School : Введение в Linked Data и Semantic Web
 
Open data
Open dataOpen data
Open data
 
Язык R в маркетинге и бизнесе
Язык R в маркетинге и бизнесеЯзык R в маркетинге и бизнесе
Язык R в маркетинге и бизнесе
 
Технологии Semantic Web. Часть I. Введение
Технологии Semantic Web. Часть I. ВведениеТехнологии Semantic Web. Часть I. Введение
Технологии Semantic Web. Часть I. Введение
 
Поиск_Яндекса: год_спустя
Поиск_Яндекса: год_спустяПоиск_Яндекса: год_спустя
Поиск_Яндекса: год_спустя
 

Destacado

Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностейДенис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностейDev_Party
 
Анна Крижановская, Playrix — Продвижение мобильных приложений: Deep Dive
Анна Крижановская, Playrix — Продвижение мобильных приложений: Deep DiveАнна Крижановская, Playrix — Продвижение мобильных приложений: Deep Dive
Анна Крижановская, Playrix — Продвижение мобильных приложений: Deep DiveDev_Party
 
Анатолий Полицын, агентство интернет-маркетинга «Синапс» — Корпоративный хост...
Анатолий Полицын, агентство интернет-маркетинга «Синапс» — Корпоративный хост...Анатолий Полицын, агентство интернет-маркетинга «Синапс» — Корпоративный хост...
Анатолий Полицын, агентство интернет-маркетинга «Синапс» — Корпоративный хост...Dev_Party
 
Игорь Цупко, Notamedia — Документация? Не слышал
Игорь Цупко, Notamedia — Документация? Не слышалИгорь Цупко, Notamedia — Документация? Не слышал
Игорь Цупко, Notamedia — Документация? Не слышалDev_Party
 
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...Dev_Party
 
Владимир Варнавский, интернет-студия «33 Кита» — Идеальный программист
Владимир Варнавский, интернет-студия «33 Кита» — Идеальный программистВладимир Варнавский, интернет-студия «33 Кита» — Идеальный программист
Владимир Варнавский, интернет-студия «33 Кита» — Идеальный программистDev_Party
 
Анастасия Распопина, Percona — Feel at Home в на 90% распределённой компании:...
Анастасия Распопина, Percona — Feel at Home в на 90% распределённой компании:...Анастасия Распопина, Percona — Feel at Home в на 90% распределённой компании:...
Анастасия Распопина, Percona — Feel at Home в на 90% распределённой компании:...Dev_Party
 
Александр Чистяков, Git in Sky — Современные тенденции в разработке программн...
Александр Чистяков, Git in Sky — Современные тенденции в разработке программн...Александр Чистяков, Git in Sky — Современные тенденции в разработке программн...
Александр Чистяков, Git in Sky — Современные тенденции в разработке программн...Dev_Party
 
Игорь Иванов, Playrix — Статистические предсказания игровой активности
Игорь Иванов, Playrix — Статистические предсказания игровой активностиИгорь Иванов, Playrix — Статистические предсказания игровой активности
Игорь Иванов, Playrix — Статистические предсказания игровой активностиDev_Party
 
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...Dev_Party
 
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...Dev_Party
 
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?Dev_Party
 
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...Dev_Party
 
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФСРоман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФСDev_Party
 

Destacado (14)

Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностейДенис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
 
Анна Крижановская, Playrix — Продвижение мобильных приложений: Deep Dive
Анна Крижановская, Playrix — Продвижение мобильных приложений: Deep DiveАнна Крижановская, Playrix — Продвижение мобильных приложений: Deep Dive
Анна Крижановская, Playrix — Продвижение мобильных приложений: Deep Dive
 
Анатолий Полицын, агентство интернет-маркетинга «Синапс» — Корпоративный хост...
Анатолий Полицын, агентство интернет-маркетинга «Синапс» — Корпоративный хост...Анатолий Полицын, агентство интернет-маркетинга «Синапс» — Корпоративный хост...
Анатолий Полицын, агентство интернет-маркетинга «Синапс» — Корпоративный хост...
 
Игорь Цупко, Notamedia — Документация? Не слышал
Игорь Цупко, Notamedia — Документация? Не слышалИгорь Цупко, Notamedia — Документация? Не слышал
Игорь Цупко, Notamedia — Документация? Не слышал
 
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
Денис Каленбет, АО «Эр-Стайл Софтлаб» — Самокапитализация программиста. Как п...
 
Владимир Варнавский, интернет-студия «33 Кита» — Идеальный программист
Владимир Варнавский, интернет-студия «33 Кита» — Идеальный программистВладимир Варнавский, интернет-студия «33 Кита» — Идеальный программист
Владимир Варнавский, интернет-студия «33 Кита» — Идеальный программист
 
Анастасия Распопина, Percona — Feel at Home в на 90% распределённой компании:...
Анастасия Распопина, Percona — Feel at Home в на 90% распределённой компании:...Анастасия Распопина, Percona — Feel at Home в на 90% распределённой компании:...
Анастасия Распопина, Percona — Feel at Home в на 90% распределённой компании:...
 
Александр Чистяков, Git in Sky — Современные тенденции в разработке программн...
Александр Чистяков, Git in Sky — Современные тенденции в разработке программн...Александр Чистяков, Git in Sky — Современные тенденции в разработке программн...
Александр Чистяков, Git in Sky — Современные тенденции в разработке программн...
 
Игорь Иванов, Playrix — Статистические предсказания игровой активности
Игорь Иванов, Playrix — Статистические предсказания игровой активностиИгорь Иванов, Playrix — Статистические предсказания игровой активности
Игорь Иванов, Playrix — Статистические предсказания игровой активности
 
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
Александр Сербул, 1С-Битрикс — Облачный сервис персональных рекомендаций для ...
 
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
Андрей Валдуев, Playrix — Основы тестирования и примеры использования базовых...
 
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
Сергей Яркин, Тензор — RabbitMQ. Насколько ценен мех и вкусно мясо?
 
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
Дмитрий Ивакин, ООО «Пайлабс» — Node.js: realtime приложение на примере систе...
 
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФСРоман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
Роман Приходько, Владимир Беспрозванных, «Сбербанк-Технологии» — Платформа ЕФС
 

Similar a Елена Никитина, Аналитический центр при Правительстве РФ — Путь питониста, или Как мы перезапускали открытые данные в России

Инициатива на Hackforfuture 4: "Платформа открытых данных"
Инициатива на Hackforfuture 4: "Платформа открытых данных"Инициатива на Hackforfuture 4: "Платформа открытых данных"
Инициатива на Hackforfuture 4: "Платформа открытых данных"Meetup.by
 
Дата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаДата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаMax Kornev
 
Иван Бегтин: Как создавать общественные проекты на открытых данных
Иван Бегтин: Как создавать общественные проекты на открытых данныхИван Бегтин: Как создавать общественные проекты на открытых данных
Иван Бегтин: Как создавать общественные проекты на открытых данныхSocialCamp2013
 
Открытые геоданные (Citycamp 2012)
Открытые геоданные (Citycamp 2012)Открытые геоданные (Citycamp 2012)
Открытые геоданные (Citycamp 2012)Ilja Zverev
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013Gleb K
 
От свободы информации к открытым данным
От свободы информации к открытым даннымОт свободы информации к открытым данным
От свободы информации к открытым даннымIvan Begtin
 
Конкурс «Открытые данные Российской Федерации» и саммит «Открытые данные — 2015»
Конкурс «Открытые данные Российской Федерации» и саммит «Открытые данные — 2015»Конкурс «Открытые данные Российской Федерации» и саммит «Открытые данные — 2015»
Конкурс «Открытые данные Российской Федерации» и саммит «Открытые данные — 2015»Открытые данные в России
 
"Теория и практика открытых данных" (Пермь) Часть 1: Введение
"Теория и практика открытых данных" (Пермь) Часть 1: Введение"Теория и практика открытых данных" (Пермь) Часть 1: Введение
"Теория и практика открытых данных" (Пермь) Часть 1: ВведениеVitaly Vlasov
 
Открытые данные: от теории к практике
Открытые данные: от теории к практикеОткрытые данные: от теории к практике
Открытые данные: от теории к практикеMoscow IT Department
 
Открытые данные: определение, основные принципы и механизмы работы с открытым...
Открытые данные: определение, основные принципы и механизмы работы с открытым...Открытые данные: определение, основные принципы и механизмы работы с открытым...
Открытые данные: определение, основные принципы и механизмы работы с открытым...Irina Radchenko
 
Открытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьОткрытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьIvan Begtin
 
Открытые данные для Беларуси '2014
Открытые данные для Беларуси '2014Открытые данные для Беларуси '2014
Открытые данные для Беларуси '2014ushchent
 
Открытые данные, как инструмент создания собственных коммерческих приложений ...
Открытые данные, как инструмент создания собственных коммерческих приложений ...Открытые данные, как инструмент создания собственных коммерческих приложений ...
Открытые данные, как инструмент создания собственных коммерческих приложений ...DrupalCamp MSK
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Evgeniy Pavlovskiy
 
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван БегтинОткрытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван Бегтинsocamp2011
 
Гракон
ГраконГракон
Граконmikpanko
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist Irina Radchenko
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13Vladimir Krylov
 
библиотека проектов
библиотека проектов библиотека проектов
библиотека проектов LiliyaKupreychik
 

Similar a Елена Никитина, Аналитический центр при Правительстве РФ — Путь питониста, или Как мы перезапускали открытые данные в России (20)

Инициатива на Hackforfuture 4: "Платформа открытых данных"
Инициатива на Hackforfuture 4: "Платформа открытых данных"Инициатива на Hackforfuture 4: "Платформа открытых данных"
Инициатива на Hackforfuture 4: "Платформа открытых данных"
 
Дата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаДата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контента
 
Иван Бегтин: Как создавать общественные проекты на открытых данных
Иван Бегтин: Как создавать общественные проекты на открытых данныхИван Бегтин: Как создавать общественные проекты на открытых данных
Иван Бегтин: Как создавать общественные проекты на открытых данных
 
Открытые геоданные (Citycamp 2012)
Открытые геоданные (Citycamp 2012)Открытые геоданные (Citycamp 2012)
Открытые геоданные (Citycamp 2012)
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013
 
От свободы информации к открытым данным
От свободы информации к открытым даннымОт свободы информации к открытым данным
От свободы информации к открытым данным
 
Конкурс «Открытые данные Российской Федерации» и саммит «Открытые данные — 2015»
Конкурс «Открытые данные Российской Федерации» и саммит «Открытые данные — 2015»Конкурс «Открытые данные Российской Федерации» и саммит «Открытые данные — 2015»
Конкурс «Открытые данные Российской Федерации» и саммит «Открытые данные — 2015»
 
"Теория и практика открытых данных" (Пермь) Часть 1: Введение
"Теория и практика открытых данных" (Пермь) Часть 1: Введение"Теория и практика открытых данных" (Пермь) Часть 1: Введение
"Теория и практика открытых данных" (Пермь) Часть 1: Введение
 
Открытые данные: от теории к практике
Открытые данные: от теории к практикеОткрытые данные: от теории к практике
Открытые данные: от теории к практике
 
Открытые данные: определение, основные принципы и механизмы работы с открытым...
Открытые данные: определение, основные принципы и механизмы работы с открытым...Открытые данные: определение, основные принципы и механизмы работы с открытым...
Открытые данные: определение, основные принципы и механизмы работы с открытым...
 
Открытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьОткрытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимость
 
Открытые данные для Беларуси '2014
Открытые данные для Беларуси '2014Открытые данные для Беларуси '2014
Открытые данные для Беларуси '2014
 
Открытые данные, как инструмент создания собственных коммерческих приложений ...
Открытые данные, как инструмент создания собственных коммерческих приложений ...Открытые данные, как инструмент создания собственных коммерческих приложений ...
Открытые данные, как инструмент создания собственных коммерческих приложений ...
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Crowdfunding in Russia
Crowdfunding in RussiaCrowdfunding in Russia
Crowdfunding in Russia
 
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван БегтинОткрытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
 
Гракон
ГраконГракон
Гракон
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13
 
библиотека проектов
библиотека проектов библиотека проектов
библиотека проектов
 

Елена Никитина, Аналитический центр при Правительстве РФ — Путь питониста, или Как мы перезапускали открытые данные в России

  • 1. Путь питониста, или Как мы перезапускали открытые данные в России 25 марта 2017 года, Вологда Пятая конференция разработчиков ПО «DevParty» Елена Никитина Аналитический центр при Правительстве РФ
  • 2. Открытые данные: что это, зачем они и где их взять?
  • 3. Data Mining… (Data Parsing, Data Scraping…) Open data: свобода доступа, свобода использования, машиночитаемость (исходник картинки с Локо-Банк)(картинка с http://cu-status.com.ua) VS • Не нужно лишней работы - данные уже кем-то подготовлены за вас • Всегда в одном месте (обычно домен/opendata) • Их кто-то хранит за вас (вместе с предыдущими версиями) • Сами обновляются • Совсем идеальный случай – данные связаны между собой (LOD) • Просто берете и используете, бесплатно, без соглашений и ограничений… • … качаете 10 Гб без ограничения скорости. Не то что на файлообменниках 3
  • 4. Torgi.gov.ru – государственный сайт для проведения торгов
  • 5. Проект Земельные торги России – удобный и простой доступ к торгам
  • 6. Проект Земельные торги России – инициатива, которая что-то меняет
  • 10. Проект Российские школы – мотивирует открывать данные
  • 11. 11 Кто выкладывает Где выкладывает Федеральные, региональные, муниципальные ОГВ сайт/opendata. Например, минобрнауки.рф/opendata Подведомственные организации федеральных ОГВ сайт/opendata. Например, obrnadzor.gov.ru/opendata Все те же самые На федеральном портале data.gov.ru Все те же самые На отдельных порталах Например, opendata.mon.gov.ru, opendata.gov35.ru Все те же самые и кто угодно через API http://api.duma.gov.ru Кто угодно на ftp ftp://free:free@ftp.zakupki.gov.ru, ftp://gmuext:YctTa34AdOPyld2@ftp.bus.gov.ru Кто угодно где угодно На своем портале: hubofdata.ru, kaggle.com Где взять открытые данные?
  • 12. Kaggle / ЗАДАЧИ + РЕШЕНИЯ + ДАННЫЕ. ОТКРЫТЫЕ ДАННЫЕ ‘Your Home for Data Science’ https://www.kaggle.com/Открытые данные в России 12
  • 14. 2015 год: начало 14 • Федеральный портал открытых данных: менее 3 000 наборов данных плохого качества ни о чем (большая часть которых не обновлялась с 2013 г). • Программисты не знают, что такое открытые данные. И даже не спрашивают, что это такое. • Госорганы боятся программистов… • …и тоже не знают, что такое открытые данные. • Госорганы не хотят связываться с открытием новых данных. 2017 год: начало • Федеральный портал открытых данных: почти 13 000 наборов данных, среди них появились интересные обновляющиеся данные. • Программисты начинают спрашивать, где взять открытые данные. И уже перестали спрашивать, что это такое. • Госорганы вживую встречаются с программистами на хакатонах… • …и потихоньку начинают разбираться в своих собственных открытых данных. • Госорганы начинают открывать данные по своей инициативе.
  • 15. Какие мероприятия мы сделали за 2 года 15 • 4 хакатона Data.gov.ru Hackathon 2015-2016 гг. Последние – за 100 человек участников. Бюджет – еда. Призы начали давать партнеры, начиная со второго хакатона. • Первый Всероссийский конкурс «Открытые данные Российской Федерации» сентябрь-ноябрь 2015 г. Подано около 100 заявок. Бюджет: 0 рублей. Госфинансирование: 0 рублей. • Первый Общероссийский саммит по открытым данным декабрь 2015 г. Бюджет 4,5 млн от привлеченных партнеров. Около 600 участников. Госфинансирование: 0 рублей. • Open Data Bootcamp – 2-месячный интенсив по обучению созданию стартапов на открытых данных октябрь-ноябрь 2016 г. Подано 32 заявки, количество участников: 15. Один из проектов, HouseScan, успешно развивается и использует открытые данные. Бюджет: 0 рублей. Госфинансирование: 0 рублей. Участие: бесплатное. • Семинары и вебинары для госорганов. Рекорд – больше 700 (!) человек на вебинаре по открытым данным для региональных органов власти в 2016 г. Выступления на митапах и конференциях и пр.
  • 16. Федеральный портал data.gov.ru. Просто чтобы вы знали, что он есть 16
  • 17. Открытые данные: как Си-шник превратился в питониста благодаря интересному проекту
  • 18. Проект Декларатор – единственное в России место, где уцелели все данные о доходах чиновников за много лет 18
  • 19. Проект Декларатор – единственное в России место, где уцелели все данные о доходах чиновников за много лет 19
  • 20. Проект Декларатор: проблема в исходных данных 20 DOC, XLS, PDF…
  • 22. Как поговорить с Moscow Python о менторах на хакатон… и внезапно выступить на митапе 22
  • 23. МК по парсингу данных… на Python (Нетология) 23
  • 24. 24 МК по парсингу данных… на Python (Нетология) – пруф  https://vimeo.com/200793648
  • 25. 25 МК по парсингу данных… на Python (Нетология) – пруф 
  • 26. БЛАГОДАРЮ ЗА ВНИМАНИЕ Елена Никитина Открытые данные в России fb.com/OpenDataInRussia e.nikitina@ac.gov.ru fb.com/Shorstko

Notas del editor

  1. Классическая схема модели управления – для согласования понятий.
  2. Классическая схема модели управления – для согласования понятий.
  3. Классическая схема модели управления – для согласования понятий.
  4. Классическая схема модели управления – для согласования понятий.
  5. Классическая схема модели управления – для согласования понятий.
  6. Классическая схема модели управления – для согласования понятий.
  7. Классическая схема модели управления – для согласования понятий.
  8. Классическая схема модели управления – для согласования понятий.