SlideShare a Scribd company logo
Статистические	данные:	
как	анализировать?
ВЕБИНАР 29 СЕНТЯБРЯ	2017	Г.
ИРИНА	РАДЧЕНКО	(IRADCHE@GMAIL.COM)
Анализ	данных
Поиск	неких	шаблонов	в	данных,	моделирование	и	тд.
Примеры	и	инструкции:	
2http://www.datadrivenjournalism.ru/
Очень	легко	сделать	математические	ошибки.
Пример	ошибок	в	статье:	
http://inosmi.ru/social/20140905/222814116.html
3
Вычисление	процентов
X	нов – X	стар
__________
X	стар
Пример:	
ДТП	в	этом	году	60,	а	в	прошлом	– 40.	Увеличилось	количество	ДТП	на	20/40	=	½
ДТП	в	этом	году	40,	а	в	прошлом	– 60.	Уменьшилось	количество	ДТП на	-20/60=-1/3	
4
Нормировка	(для	сравнивания)
Значение	(событие)
___________________				x						Количество	населения
Население
Пример:
60	ДТП																																																																														40 ДТП
_________			x	 1	000		=	60 ДТП	на	1	000	людей						_________			x 1	000	=	80 ДТП	на	1	000	людей
1	000 500
5
Теория	четырех	Россий
«Согласно	центро-периферийной	теории,	любое	заселенное	людьми	пространство	
иерархично.	Оно	делится	на	центр,	полупериферию и	периферию.	Центр	в	масштабах	
страны	— крупные	и	крупнейшие	города	(Россия-1).	Полупериферию,	второй	
иерархический	уровень,	образуют	менее	крупные	и	средние	города	(Россия-2).	Наконец,	
есть	периферия	— самая	обширная	часть	пространства,	сельские	поселения	и	малые	
города	(Россия-3).	Эти	три	типа	пространства,	которые	соединены	на	территории	страны	и	
присутствуют	в	каждом	регионе,	имеют	разный	социум	и	разные	ресурсы	развития.	Как	
следствие,	различается	их	скорость	модернизации.
А	Россия-4	— это	Северный	Кавказ.	Там	модернизационные процессы	начались	позже,	и	
центро-периферийная	модель	пока	не	очень	работает.	Но	лет	через	50	на	Северном	
Кавказе	будет,	как	сегодня	в	России».
Источник:	https://www.novayagazeta.ru/articles/2013/11/18/57242-171-chetyre-rossii-187-na-
odnoy-territorii (Из	интервью	с	Натальей	Васильевной	Зубаревич),	а	также	см.	
https://www.vedomosti.ru/opinion/articles/2011/12/30/chetyre_rossii?
6
Среднее,	медиана,	мода	и	выброс
Медиана – число	выборки:	ровно	половина	из	элементов	выборки	больше	него,	а	другая	
половина	меньше	него.
Среднее	арифметическое	– сумма	всех	чисел,	разделенная	на	их	количество.
Мода – значение,	которое	встречается	наиболее	часто.
Выброс – результат	измерения,	выделяющийся	из	общей	выборки.
7
Автоматическая	описательная	
статистика	в	LibreOffice
8
Автоматическая	описательная	
статистика	в	LibreOffice
9
Корреляция
	Корреля́ция (от лат. correlatio «соотношение,	взаимосвязь»)	или корреляционная	
зависимость — статистическая взаимосвязь	двух	или	более случайных	величин (либо	
величин,	которые	можно	с	некоторой	допустимой	степенью	точности	считать	таковыми).	
При	этом	изменения	значений	одной	или	нескольких	из	этих	величин	сопутствуют	
систематическому	изменению	значений	другой	или	других	величин.
	
	Источник:	https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%80%D1%80
%D0%B5%D0%BB%D1%8F%D1%86%D0%B8%D1%8F	
Общая	теория	статистики:	Учебник	/	Под	ред. Р.	А.	Шмойловой. —	3-е	издание,	
переработанное. —	Москва:	Финансы	и	Статистика,	2002. —	560 с. — ISBN	5-279-01951-8.
	
	
10
Корреляция
Понятие	коэффициента корреляции в статистическом	анализе является единицей	
измерения	того, насколько хорошо спрогнозированное	значение соотносится	с	реальными	
данными. Оно	дает	нам	понимание, насколько хорошо	прогностика продемонстрировала	
свою "пригодность" при	работе с	реальными	данными.
Коэффициент	корреляции это число	между	0	и	1. Если соотношений между	
спрогнозированными	значениями	и	реальными	данными	не	обнаружено,	коэффициент	
корреляции будет	равен 0	или	очень	близко к	этому. Чем	выше	соотношение между	
спрогнозированными	значениями	и	реальными данными, тем	лучше	и коэффициент	
корреляции. Абсолютно	приемлемый	результат дает	коэффициент	1.0. Таким	образом,	
чем выше	коэффициент	корреляции,	тем лучше.
Источник:	http://www.timingsolution.ru/WebHelp/scr/ts_r.htm
11
Корреляция
Отождествление	корреляции	и	причинности —
ошибка,	состоящая	в	убеждении,	что	наличие	
корреляции	означает	причинно-следственную	связь.
Список	логических	ошибок:	
https://ru.rationalwiki.org/wiki/%D0%9B%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%
D0%BA%D0%B0%D1%8F_%D0%BE%D1%88%D0%B8%D0%B1%D0%BA%D0%B0
12
Вычисление	корреляции	в	LibreOffice
13
Вычисление	корреляции	в	LibreOffice
14
Полезное.	
Закрепление	строк/столбцов
15
Полезное.	
Форматирование	ячеек	с	числами
16
Полезное.	Сортировка
17
37
http://iRadche.livejournal.com/
https://www.facebook.com/iRadche
@iRadche
http://www.slideshare.net/iRadche
Спасибо за внимание!
http://iRadche.ru
http://about.me/Irina.Radchenko

More Related Content

ODP
Продвижение мероприятий
PDF
Современный WiFi
PDF
Что такое дизайн-мышление?
PDF
работа с партнерами
PPTX
Сквозная аналитика до продаж. Зачем вам это. Как выстроить по шагам. Кейсы
PDF
Сервис-дизайн. Гайд для разработчиков.
PDF
Тренды SMM 2015
PDF
Как и чему нужно учиться? Секреты эффективного резюме Роман Дусенко #ТолькоВп...
Продвижение мероприятий
Современный WiFi
Что такое дизайн-мышление?
работа с партнерами
Сквозная аналитика до продаж. Зачем вам это. Как выстроить по шагам. Кейсы
Сервис-дизайн. Гайд для разработчиков.
Тренды SMM 2015
Как и чему нужно учиться? Секреты эффективного резюме Роман Дусенко #ТолькоВп...

Viewers also liked (20)

PDF
О чем писать в социальных сетях и блоге? — MarkEd
PPTX
Smm strategy eic english new
PPTX
Разработка стратегии интернет маркетинга (Вебинар в академии Sendpulse)
PDF
Как мы лайкаем? Значение эмоциональных лайков в Facebook
PDF
Презентация Евгении Синепол "PR-текст" с вебинара для Mediatk.ru
PPTX
Омниканальность в рознице (синергия offline- и online-продаж) / Михаил Заборо...
PDF
Социальные сети: Путь к успеху
PPTX
[Ad4Events] Анастасия Широкова "ПР мероприятия"
PDF
Провокационный PR в социальных медиа: комплексная оценка эффективности
PDF
Эффективный руководитель Как управлять людьми на основе общих ценностей масте...
PPTX
Карта России - PowerPoint шаблон для создания профессиональных презентаций
PDF
Готовые PR-решения для вашего банка
PDF
Что надо сделать, чтобы СМИ написали о мероприятии
PPTX
Restalytika HelpLine
PDF
Изучение репутации: от поиска инсайтов до консалтинга
PDF
Yandex helpline 22.11
PDF
01 Марушко Дмитрий - BizTech BSU StartUp Contest - опыт создания университетс...
PPTX
8 шагов как построить успешный бизнес: от стратегии до команды
PDF
Интернет-маркетинг - PowerPoint шаблон для создания профессиональных презентаций
PDF
PR-акции, о которых напишут все СМИ
О чем писать в социальных сетях и блоге? — MarkEd
Smm strategy eic english new
Разработка стратегии интернет маркетинга (Вебинар в академии Sendpulse)
Как мы лайкаем? Значение эмоциональных лайков в Facebook
Презентация Евгении Синепол "PR-текст" с вебинара для Mediatk.ru
Омниканальность в рознице (синергия offline- и online-продаж) / Михаил Заборо...
Социальные сети: Путь к успеху
[Ad4Events] Анастасия Широкова "ПР мероприятия"
Провокационный PR в социальных медиа: комплексная оценка эффективности
Эффективный руководитель Как управлять людьми на основе общих ценностей масте...
Карта России - PowerPoint шаблон для создания профессиональных презентаций
Готовые PR-решения для вашего банка
Что надо сделать, чтобы СМИ написали о мероприятии
Restalytika HelpLine
Изучение репутации: от поиска инсайтов до консалтинга
Yandex helpline 22.11
01 Марушко Дмитрий - BizTech BSU StartUp Contest - опыт создания университетс...
8 шагов как построить успешный бизнес: от стратегии до команды
Интернет-маркетинг - PowerPoint шаблон для создания профессиональных презентаций
PR-акции, о которых напишут все СМИ
Ad

More from Irina Radchenko (20)

PDF
Аналитик, данные и джаз
PDF
Open access as is
PDF
Как и где искать открытые данные?
PDF
Дата-экспедиции. Data Expeditions
PDF
Data expedition
PDF
Data Expeditions Eduthon
PDF
Анализ 
и визуализация данных
PDF
Data management syllabus
PDF
Data journalist
PDF
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
PDF
FREYA project
PDF
How to become a Data Scientist
PDF
Вебинар по статистике
PDF
Программа CATT
PDF
Open Data aspects
PDF
Introduction to Data Journalism
PDF
Introduction to Open Data
PDF
Open Data hackathons in Russia
PDF
Working with Open Data
PDF
Introduction to Data Journalism
Аналитик, данные и джаз
Open access as is
Как и где искать открытые данные?
Дата-экспедиции. Data Expeditions
Data expedition
Data Expeditions Eduthon
Анализ 
и визуализация данных
Data management syllabus
Data journalist
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
FREYA project
How to become a Data Scientist
Вебинар по статистике
Программа CATT
Open Data aspects
Introduction to Data Journalism
Introduction to Open Data
Open Data hackathons in Russia
Working with Open Data
Introduction to Data Journalism
Ad

Webinar3. Data analysis