SlideShare una empresa de Scribd logo
1 de 26
Descargar para leer sin conexión
Журналистика данных
в СМИ и обществе
Подготовила Кристина Шведа
“Журналистика данных рассказывает
истории людей с помощью чисел”
Саймон Роджерс, Google, the Guardian
(не только новости экономики, но все самые важные темы)
Данные повсюду – если
обращать внимание, и это
не только статистика
Новости: вы доверяете
мнениям или данным?
Но! Данные тоже субъективны - собраны людьми
http://www.dear-data.com/all
Журналистские
расследования:
Великобритания, скандал
2009 о расходах депутатов
(MP’s expenses scandal)
1. Сотрудник рассказал газетам
о произволе депутатов
2. Журналисты отправили FOI-
запросы в правительство
3. Правительство опубликовало
данные и открыло коммиссию по
контролю бюджета депутатов
(IPSA)
4. Необходимость улучшить
интерфейс доступа к данным
Отдел кибер-расследований The
Times:
Журналист + статист+
программист
-> моделирование
демографичесих данных,
анализ больших данных
Проверка фактов (Fact-checking)
Нет стоит слепо повторять цифры за политиками, если их можно проверить
Разоблачения и утечка информации
(whistleblowing and leaks): жертвы ради правды
Wikileaks, Джулиан Ассанж, Челси
Мэннинг - фильм “Пятая власть”
NSA Leaks, Эдвард Сноуден, Лаура
Поитрас, фильм “Citizenfour: Правда
Сноудена”
Swiss Leaks (банк HSBC), Эрве
Фальчани, Мар Кабра, Джеймс Бол
Luxembourg Leaks, уход от налогов
Хакер Ассанж в 1995
Открытые данные в Великобритании
1. 2000 Акт о свободе доступа к информации (Freedom of Information Act) -> FOI-запрос в гос
органы
2. 2000-ые - данные доступны платно, e.g. Companies House (данные о компаниях)
3. 2006 Кампания the Guardian “Освободите наши данные” (Free our data)
4. 2010 Под давлением открыт правительственный сайт открытых данных (data.gov.uk/ons.gov.uk)
Для сравнения: Белстату не помешает
1. Регулярное обновление данных, 2. Сырые данные, а не только сводки, 3. Машиночитаемые
форматы (csv, json), 4. ? бесплатный свободный доступ к информации для всех граждан
Где искать данные: 10 идей для Беларуси
1. Задайтесь вопросом “кто собирает информацию” и обратитесь к менеджеру среднего
звена за советом (в идеале как студент или ученый, а не журналаст)
2. Международные порталы открытых данных (небольшой список здесь) и белорусский
портал открытых данных (группа энтузиастов сделает и на заказ)
3. Запросы FOI в Европейские госорганы - например, о связях с Беларусью
4. Исследовательские институты, контакты с учеными
5. Запрятанные данные: финансовые отчеты компаний для инфесторов
6. Профессиональные соц. опросы, crowdsourcing информации (Google Forms)
7. Scraping и API (например, Twitter)
8. Google advanced search на нескольких языках
9. Собрать данные усилиями своей команды
10. Сотрудничество с крупными расследовательскими организациями, например,
Organised Crime and Corruption Reporting Project (специализируется на Восточной Европе),
агентство Jplusplus, International Consortium of Investigative Journalism...
Хартия + Jplusplus в 2014
Сложные данные можно собрать самим
Верификация
Расследования Bellingcat
(Элиот Хиггинс) с помощью
чисто открытых источников
–
социальных сетей, Google-
карт, Youtube
“По следам сепаратистов"
Данные в поддержку важных событий
помогает людям понять, что происходит в их стране
Карты
для иллюстрации географически-привязанных тем, например, война в Сирии
FT
Начиная с простого: карты CartoDB
The Bureau of Investigative Journalism: война дронами
Объяснение сложных тем
например, как рынок нефти влияет на международные отношения (NYTimes oil prices)
Новостные приложения (news apps)
для многогранных историй
В Британских изданиях
90% быстрые истории
● Новости о свежих выпусках
статистики
● Опросы
● Сыежие научные исследования
● Курирование данных на тему
(“Пять вещей вы не знали о…”
● Эксклюзивные находки в
опубликованной статистике
● Локальные истории, найденные в
крупных датасетах
● Опровержения
10% крупные проекты
● Расследования
● Кастомные визуализации (d3.js или
статика)
● Моделирование данных
● Новостные приложения
● Интерактивные лонг-риды
Курирование данных:
данные из разных источников
Доказание/опровержение гипотезы
Локальная журналистика
Бизнес-издания:
данные еще более актуальны
Как врать с помощью статистики… more crazy examples
Skillset of the ultimate data journalist
● Proficiency using one or more programming languages, such as Python, R or SQL – for
data scraping, parsing and analysis
● Statistical methods (advanced Excel, R)
● Data visualization design (Adobe Illustrator, Photoshop)
● Front-end web development (D3.js, HTML5, CSS3, Javascript, GIS)
team work
Skillset of a data-driven journalist
● Advanced search, open data portals, FOI
● Finding stories in data (Excel)
● Interactive visualisation tools (charting tools like DataWrapper, HighCharts, qz
Chartbuilder; mapping tools like CartoDB; visual analytics like Tableau; other UI-based
digital tools like Knightlab Juxtapose)
Сообщество
Mailing lists: Nicar-l, Data-driven-journalism, School of data; get
developer friends.
Teach yourself (tutorials online like Code Academy, Khan Academy,
MOOCs like Learno), google your errors, specialise in what you’re good
at.
Find me: @kr

Más contenido relacionado

La actualidad más candente

Ya marketer
Ya marketerYa marketer
Ya marketerYandex
 
Три кнопки Рунета (доклад на 10 РИФ, 2006 год)
Три кнопки Рунета  (доклад на 10 РИФ,  2006 год) Три кнопки Рунета  (доклад на 10 РИФ,  2006 год)
Три кнопки Рунета (доклад на 10 РИФ, 2006 год) Timur AITOV
 
RST2014_Petrozavodsk_SmartSearchSystem
RST2014_Petrozavodsk_SmartSearchSystemRST2014_Petrozavodsk_SmartSearchSystem
RST2014_Petrozavodsk_SmartSearchSystemRussianStartupTour
 
RST2014_Petrozavodsk_SmartStore
RST2014_Petrozavodsk_SmartStoreRST2014_Petrozavodsk_SmartStore
RST2014_Petrozavodsk_SmartStoreRussianStartupTour
 
Компьютерная лингвистика в Яндексе
Компьютерная лингвистика в ЯндексеКомпьютерная лингвистика в Яндексе
Компьютерная лингвистика в ЯндексеYandex
 
Дмитрий Иванов "Где мой трафик, чувак? Самые популярные способы потерять SEO...
Дмитрий Иванов  "Где мой трафик, чувак? Самые популярные способы потерять SEO...Дмитрий Иванов  "Где мой трафик, чувак? Самые популярные способы потерять SEO...
Дмитрий Иванов "Где мой трафик, чувак? Самые популярные способы потерять SEO...SEO.UA
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS) Fred Kozlov
 

La actualidad más candente (9)

Ya marketer
Ya marketerYa marketer
Ya marketer
 
Три кнопки Рунета (доклад на 10 РИФ, 2006 год)
Три кнопки Рунета  (доклад на 10 РИФ,  2006 год) Три кнопки Рунета  (доклад на 10 РИФ,  2006 год)
Три кнопки Рунета (доклад на 10 РИФ, 2006 год)
 
RST2014_Petrozavodsk_SmartSearchSystem
RST2014_Petrozavodsk_SmartSearchSystemRST2014_Petrozavodsk_SmartSearchSystem
RST2014_Petrozavodsk_SmartSearchSystem
 
RST2014_Petrozavodsk_SmartStore
RST2014_Petrozavodsk_SmartStoreRST2014_Petrozavodsk_SmartStore
RST2014_Petrozavodsk_SmartStore
 
Компьютерная лингвистика в Яндексе
Компьютерная лингвистика в ЯндексеКомпьютерная лингвистика в Яндексе
Компьютерная лингвистика в Яндексе
 
Presentation2005
Presentation2005Presentation2005
Presentation2005
 
Дмитрий Иванов "Где мой трафик, чувак? Самые популярные способы потерять SEO...
Дмитрий Иванов  "Где мой трафик, чувак? Самые популярные способы потерять SEO...Дмитрий Иванов  "Где мой трафик, чувак? Самые популярные способы потерять SEO...
Дмитрий Иванов "Где мой трафик, чувак? Самые популярные способы потерять SEO...
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS)
 
Tr data feb_2012
Tr data feb_2012Tr data feb_2012
Tr data feb_2012
 

Similar a Журналистика данных в СМИ и обществе

Журналистика данных: история из цифр
Журналистика данных: история из цифрЖурналистика данных: история из цифр
Журналистика данных: история из цифрARTW
 
Data journalism (Журналистика Данных)
Data journalism (Журналистика Данных)Data journalism (Журналистика Данных)
Data journalism (Журналистика Данных)Ivan Begtin
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Evgeniy Pavlovskiy
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013Gleb K
 
Big Data: вызовы и возможности
Big Data: вызовы и возможностиBig Data: вызовы и возможности
Big Data: вызовы и возможностиStanislav Makarov
 
Дата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаДата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаMax Kornev
 
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван БегтинОткрытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван Бегтинsocamp2011
 
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.ushchent
 
BIG DATA: your personal information that everyone needs
BIG DATA: your personal information that everyone needsBIG DATA: your personal information that everyone needs
BIG DATA: your personal information that everyone needsGeorgy Slugin
 
Microsoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechMicrosoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechAndrey Burlutskiy
 
Social Media Analytics: Технологии исследования будущего
Social Media Analytics: Технологии исследования будущегоSocial Media Analytics: Технологии исследования будущего
Social Media Analytics: Технологии исследования будущегоСветлана Крылова
 
Выступление на Solit-2013
Выступление на Solit-2013Выступление на Solit-2013
Выступление на Solit-2013ushchent
 
выступление на Idc russia 2013 ppt
выступление на Idc russia 2013 pptвыступление на Idc russia 2013 ppt
выступление на Idc russia 2013 pptAnatoli Stoyanovski
 
Semantic archive for economic security servecis
Semantic archive for economic security servecisSemantic archive for economic security servecis
Semantic archive for economic security servecisssuser0170f41
 
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...HRPR Camp - Самое технологичное событие в HR
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13Vladimir Krylov
 
Обработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхОбработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхIrina Radchenko
 

Similar a Журналистика данных в СМИ и обществе (20)

Журналистика данных: история из цифр
Журналистика данных: история из цифрЖурналистика данных: история из цифр
Журналистика данных: история из цифр
 
Data journalism (Журналистика Данных)
Data journalism (Журналистика Данных)Data journalism (Журналистика Данных)
Data journalism (Журналистика Данных)
 
Границы и тенденции бизнес-исследований _ Тамара Кулинкович _ www.businessres...
Границы и тенденции бизнес-исследований _ Тамара Кулинкович _ www.businessres...Границы и тенденции бизнес-исследований _ Тамара Кулинкович _ www.businessres...
Границы и тенденции бизнес-исследований _ Тамара Кулинкович _ www.businessres...
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013
 
Big Data: вызовы и возможности
Big Data: вызовы и возможностиBig Data: вызовы и возможности
Big Data: вызовы и возможности
 
Дата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаДата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контента
 
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван БегтинОткрытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
 
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
Скрытый капитал открытых данных: кто и как может им воспользоваться в Беларуси.
 
BIG DATA: your personal information that everyone needs
BIG DATA: your personal information that everyone needsBIG DATA: your personal information that everyone needs
BIG DATA: your personal information that everyone needs
 
Microsoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechMicrosoft BigData event @ Bibliotech
Microsoft BigData event @ Bibliotech
 
Social Media Analytics: Технологии исследования будущего
Social Media Analytics: Технологии исследования будущегоSocial Media Analytics: Технологии исследования будущего
Social Media Analytics: Технологии исследования будущего
 
Выступление на Solit-2013
Выступление на Solit-2013Выступление на Solit-2013
Выступление на Solit-2013
 
Stolyarevska_data_scientist
Stolyarevska_data_scientistStolyarevska_data_scientist
Stolyarevska_data_scientist
 
выступление на Idc russia 2013 ppt
выступление на Idc russia 2013 pptвыступление на Idc russia 2013 ppt
выступление на Idc russia 2013 ppt
 
Semantic archive for economic security servecis
Semantic archive for economic security servecisSemantic archive for economic security servecis
Semantic archive for economic security servecis
 
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
 
Big datatech by-vkrylov
Big datatech by-vkrylovBig datatech by-vkrylov
Big datatech by-vkrylov
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13
 
Обработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхОбработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данных
 

Журналистика данных в СМИ и обществе

  • 1. Журналистика данных в СМИ и обществе Подготовила Кристина Шведа
  • 2. “Журналистика данных рассказывает истории людей с помощью чисел” Саймон Роджерс, Google, the Guardian (не только новости экономики, но все самые важные темы)
  • 3. Данные повсюду – если обращать внимание, и это не только статистика Новости: вы доверяете мнениям или данным? Но! Данные тоже субъективны - собраны людьми http://www.dear-data.com/all
  • 4. Журналистские расследования: Великобритания, скандал 2009 о расходах депутатов (MP’s expenses scandal) 1. Сотрудник рассказал газетам о произволе депутатов 2. Журналисты отправили FOI- запросы в правительство 3. Правительство опубликовало данные и открыло коммиссию по контролю бюджета депутатов (IPSA) 4. Необходимость улучшить интерфейс доступа к данным
  • 5. Отдел кибер-расследований The Times: Журналист + статист+ программист -> моделирование демографичесих данных, анализ больших данных
  • 6. Проверка фактов (Fact-checking) Нет стоит слепо повторять цифры за политиками, если их можно проверить
  • 7. Разоблачения и утечка информации (whistleblowing and leaks): жертвы ради правды Wikileaks, Джулиан Ассанж, Челси Мэннинг - фильм “Пятая власть” NSA Leaks, Эдвард Сноуден, Лаура Поитрас, фильм “Citizenfour: Правда Сноудена” Swiss Leaks (банк HSBC), Эрве Фальчани, Мар Кабра, Джеймс Бол Luxembourg Leaks, уход от налогов Хакер Ассанж в 1995
  • 8. Открытые данные в Великобритании 1. 2000 Акт о свободе доступа к информации (Freedom of Information Act) -> FOI-запрос в гос органы 2. 2000-ые - данные доступны платно, e.g. Companies House (данные о компаниях) 3. 2006 Кампания the Guardian “Освободите наши данные” (Free our data) 4. 2010 Под давлением открыт правительственный сайт открытых данных (data.gov.uk/ons.gov.uk)
  • 9. Для сравнения: Белстату не помешает 1. Регулярное обновление данных, 2. Сырые данные, а не только сводки, 3. Машиночитаемые форматы (csv, json), 4. ? бесплатный свободный доступ к информации для всех граждан
  • 10. Где искать данные: 10 идей для Беларуси 1. Задайтесь вопросом “кто собирает информацию” и обратитесь к менеджеру среднего звена за советом (в идеале как студент или ученый, а не журналаст) 2. Международные порталы открытых данных (небольшой список здесь) и белорусский портал открытых данных (группа энтузиастов сделает и на заказ) 3. Запросы FOI в Европейские госорганы - например, о связях с Беларусью 4. Исследовательские институты, контакты с учеными 5. Запрятанные данные: финансовые отчеты компаний для инфесторов 6. Профессиональные соц. опросы, crowdsourcing информации (Google Forms) 7. Scraping и API (например, Twitter) 8. Google advanced search на нескольких языках 9. Собрать данные усилиями своей команды 10. Сотрудничество с крупными расследовательскими организациями, например, Organised Crime and Corruption Reporting Project (специализируется на Восточной Европе), агентство Jplusplus, International Consortium of Investigative Journalism...
  • 12. Сложные данные можно собрать самим
  • 13. Верификация Расследования Bellingcat (Элиот Хиггинс) с помощью чисто открытых источников – социальных сетей, Google- карт, Youtube “По следам сепаратистов"
  • 14. Данные в поддержку важных событий помогает людям понять, что происходит в их стране
  • 16. Начиная с простого: карты CartoDB The Bureau of Investigative Journalism: война дронами
  • 17. Объяснение сложных тем например, как рынок нефти влияет на международные отношения (NYTimes oil prices)
  • 18. Новостные приложения (news apps) для многогранных историй
  • 19. В Британских изданиях 90% быстрые истории ● Новости о свежих выпусках статистики ● Опросы ● Сыежие научные исследования ● Курирование данных на тему (“Пять вещей вы не знали о…” ● Эксклюзивные находки в опубликованной статистике ● Локальные истории, найденные в крупных датасетах ● Опровержения 10% крупные проекты ● Расследования ● Кастомные визуализации (d3.js или статика) ● Моделирование данных ● Новостные приложения ● Интерактивные лонг-риды
  • 20. Курирование данных: данные из разных источников
  • 24. Как врать с помощью статистики… more crazy examples
  • 25. Skillset of the ultimate data journalist ● Proficiency using one or more programming languages, such as Python, R or SQL – for data scraping, parsing and analysis ● Statistical methods (advanced Excel, R) ● Data visualization design (Adobe Illustrator, Photoshop) ● Front-end web development (D3.js, HTML5, CSS3, Javascript, GIS) team work Skillset of a data-driven journalist ● Advanced search, open data portals, FOI ● Finding stories in data (Excel) ● Interactive visualisation tools (charting tools like DataWrapper, HighCharts, qz Chartbuilder; mapping tools like CartoDB; visual analytics like Tableau; other UI-based digital tools like Knightlab Juxtapose)
  • 26. Сообщество Mailing lists: Nicar-l, Data-driven-journalism, School of data; get developer friends. Teach yourself (tutorials online like Code Academy, Khan Academy, MOOCs like Learno), google your errors, specialise in what you’re good at. Find me: @kr