SlideShare a Scribd company logo
Data mining
sociálních sítí
  BarCamp 2010, Brno
      Josef Šlerka
Kdo jsem?

- vedoucí Studia nových médií
na FF UK

- head of R&D v Ataxo Interactive

- projekty: Klábosení, Ataxo Social
Insider, Trixam a další

Twitter: www.twitter.com/josefslerka
Obsah
Česko-Slovenský Twitter 2010/Q2

Identifikace lidí

Identifikace skupin

Text Mining trochu jinak

... technologické překvapení
Česko-Slovenský Twitter 2010/Q2
čísla z www.klaboseni.cz
16.415
  aktivně píšících českých a
slovenských uživatelů Twitteru
cca 30.000
uživatelů včetně pasivních a výhradně
           anglicky píšících
Vývoj počtu uživatelů
                           českého a slovenského Twitteru
                                                           !"#$%&'()*+%$,-&
                                                                                                            '&!!!"




                                                                                                            '%!!!"




                                                                                                            '$!!!"




                                                                                                            '#!!!"




                                                                                                            '!!!!"




                                                                                                            &!!!"    0)123"45678329:"



                                                                                                            %!!!"




                                                                                                            $!!!"




                                                                                                            #!!!"




                                                                                                            !"
()*"#!!%"

            ()*"#!!+,-'"




                            ()*"#!!+,-."




                                            ()*"#!!&,-."




                                                                              ()*"#!!/,-."




                                                                                             ()*"#!!/,-$"



                                           2006 - 2010/Q2
TrustRank

   InfoChimps API
 based on PageRank
žebříček www.trst.me
Kdo je BOSS s TR 9.9?
Barack Obama:-)
... ale jak je to u nás?
Chvíle napětí....
Barcamp Brno 2010
Disclaimer




Žebříček byl sestaven pomoci Trstrank API společnosti InfoChimps.
POZOR: V současnosti žebříček přepočítáváme, protože máme dojem, že data nejsou kompletní.
Zkrátka: jak se do cloudu volá, tak se cloudu ozývá. Novou verzi oznámíme brzo. Ten dnešní je podle dat,
která nám API vrátilo ve čtvrtek 24. 6. 2010




                                                                (další info: www.klaboseni.cz/top101.php)
TOP 10 nejdůvěryhodnějších
   českých a slovenských twitteristů
1. hrouda TR 3.98
2. computer_zive TR 3.84
3. denniksme TR 3.29
4. DavidGrudl TR 3.25
5. tangero TR 3.21
6. adent TR 3.18
7. Lubos TR 3.11
8. adbar TR 3.09
9. petrkou TR 3.08
10. liborkriz TR 3.07

                  (další info: www.klaboseni.cz/top101.php)
101 “nejdůvěryhodnějších” čte
   45% uživatelů českého a
     slovenského Twitteru
Identifikace lidí
50% uživatelů
sociálních sítí má 1 nickname
a zbytek je už jen
 špinavá práce...
Facebook                 Flickr

             Delicious
Foursquare                   Last.fm


                    Twitterfeed
...čas na ukázku...
codeas
tiborholda
Identifikace skupin
CFinder
Text Mining trochu jinak
Jak poznat, že někdo lže
         aneb
 lekce pana James W.
      Pennebaker
1. Snížení počtu odkazů k vlastní osobě.

2. Snížení počtu souvětí a zejména s
vylučujícími spojkami.

3. Zvýšení počtu negativních slov.

4. Zvýšení počtu slov vyjadřující pohyb.
... technologické překvapení
Ataxo Social Insider
otázky?
Děkuji za pozornost
   slerka@ataxo.com
josef.slerka@gmail.com

More Related Content

PDF
Olympijské hry a second screening
PDF
Ways understand fans II. - Facebook
PDF
Once upon a time...
PDF
Nová média se starým obsahem
PDF
Věštění (s) Wikipedií
PDF
Fingerprinting
PDF
Informační bezpečnost
PDF
Just metadata
Olympijské hry a second screening
Ways understand fans II. - Facebook
Once upon a time...
Nová média se starým obsahem
Věštění (s) Wikipedií
Fingerprinting
Informační bezpečnost
Just metadata

Viewers also liked (14)

PDF
New Media, Big Data, IoT aneb jak to je?!
PDF
Fingerprinting a big data
PDF
Boti tady, boti tam, všude kam se podívám
PDF
#SNMstudie
PDF
Domácí Instagram léto 2015 - pár dat
PDF
Big Social Data
PDF
Český a slovenský Instagram - jaro 2014
PDF
We need to go deeper!
PDF
Informační etika
PDF
Data, informace, zákony a indexy
PDF
Jak se žije v Matrixu
PDF
Svět viděný kompresním algoritmem
PDF
The Nature of Data
PDF
Propaganda
New Media, Big Data, IoT aneb jak to je?!
Fingerprinting a big data
Boti tady, boti tam, všude kam se podívám
#SNMstudie
Domácí Instagram léto 2015 - pár dat
Big Social Data
Český a slovenský Instagram - jaro 2014
We need to go deeper!
Informační etika
Data, informace, zákony a indexy
Jak se žije v Matrixu
Svět viděný kompresním algoritmem
The Nature of Data
Propaganda
Ad

More from Ataxo Group (19)

PPT
Zaklady ppc reklamy
PDF
Česko-slovenský Facebook a Twitter v číslech
PDF
PPC Bidding Workshop at Ataxo
KEY
Twitter as a data mining source
PDF
Výkonnostní marketing jako nedílná součást mediálního mixu
PDF
Modelovanie reklamnej kampaně
PDF
On Line Reputation Management
KEY
Světový a český Twitter jako zdroj pro data mining
PPT
e-commerce 2009
PDF
Online reputation management - Matěj Novák
PPT
E Commerce 2009 - Marcela Krzemień
KEY
Matěj Novák - pro neziskovky
PPT
SEMPO a trendy internetového marketingu
KEY
Reputation Management On-line
ZIP
Internet in the Czech Republic
PDF
SEO for Yellow Pages Publishers
PDF
Case study: Optimalizace PPC kampaně
PDF
SEO @ Google University pro finanční segment
PDF
SEO – optimalizace pro vyhledávače
Zaklady ppc reklamy
Česko-slovenský Facebook a Twitter v číslech
PPC Bidding Workshop at Ataxo
Twitter as a data mining source
Výkonnostní marketing jako nedílná součást mediálního mixu
Modelovanie reklamnej kampaně
On Line Reputation Management
Světový a český Twitter jako zdroj pro data mining
e-commerce 2009
Online reputation management - Matěj Novák
E Commerce 2009 - Marcela Krzemień
Matěj Novák - pro neziskovky
SEMPO a trendy internetového marketingu
Reputation Management On-line
Internet in the Czech Republic
SEO for Yellow Pages Publishers
Case study: Optimalizace PPC kampaně
SEO @ Google University pro finanční segment
SEO – optimalizace pro vyhledávače
Ad

Barcamp Brno 2010