HTML

Ezt mondjátok

Adatkelet

Statisztika, adatok, de főképp az értelmük halandóknak

Disclaimer

I review for the O'Reilly Blogger Review Program

Gyorsjelentés a magyar szocappokról - iWiW alkalmazások 2009. október

2009.10.22. 11:22 soobrosa

Az alábbi rövid elemzést az október 9-ei nyilvános információk alapján készítettem, a havi változásokat természetesen a szeptember 9-i adatokkal számoltam, legközelebb nem kések két hetet.

Alkalmazások toplistája

A top 10 változatlan, a Machopoker (Soop) havi 14%-os növekedése, és a Zene Doboz (Idea) majd 12%-os növekedése lóg ki a mezőnyből (medián 7,6%). A 85 alkalmazásból a top 12 adja az összes installált példány 80%-át.


 
A 11. helyen kiugró, 126%-os növekedést produkált a Küldj egy piát! (Soop). A top 20 alkalmazásban kimagasló terjedést ért el a 13. helyen a Birizga (Soop) havi 87%-os növekedéssel, és a Texas Holdem Póker (gamedesire.com) a 18. helyen 48%-os felhasználói szám növekedéssel (medián 8,8%).

A medián felhasználószám felett jól pörög még az Akasztófa (ca), a Lovehunter (partnet), a Meztelen igazság (Gyerák Róbert, Terray Tamás), az alsó traktus feltörekvői pedig a Gemswapper, a My Fresh Bag, a Space Bomber és a Pannon GTK.

Alkalmazásfejlesztők toplistája

A fejlesztők meghatározó része csak egy alkalmazást készített, öten készítettek két alkalmazást, alább a kettőnél többet fejlesztők toplistája – a kukori.cát azért bevettem még a listába. Azokat az alkalmazásokat is bevettem az összesítésbe, amelyeket a készítők ismereteim szerint alvállalkozóként készítettek, ha valamit kihagytam, kommenteljetek.

A Kreatív legismertebb online/interaktív ügynökségeinek listáin szereplő 6 ügynökség által készített alkalmazások száma ismereteim szerint: 0.

(Köszönöm ct és crrr segítségét.)  

Szólj hozzá!

Címkék: iwiw statisztika alkalmazás szociális vizualizáció

A jelzálog után dőljenek a biztosítások is?

2009.09.24. 13:44 soobrosa

A származtatott jelzáloghitel papírok bedőlésének egyik oka az volt, hogy a bankárok nagyon kicsinek látták annak esélyét, hogy egyszerre sokan vagy akár mindenki fizetésképtelenné válik, és hirtelen áll meg a havi részletek megnyugtató csorgása.

Úgy tűnik a bankárok nem tanulnak - és mi sem tanulunk - semmiből, nagyon megkedvelték a származtatott termékeket, olyan jópofán szétosztják vagy elfedik a kockázatokat, hát most az életbiztosításokra repültek rá. Kérdés persze, hogy most vajon jól mérik-e majd fel a kvantokat az esélyeket. (Tényleg, miért ilyen nagy a különbség a biztosítási ipar és a szerencsejáték társadalmi megítélése között?)

Jenny Anderson: Wall Street Pursues Profit in Bundles of Life Insurance (The New York Times via Infocult)

Szólj hozzá!

Címkék: statisztika halál befektetés adat pénzügy biztosítás jelzálog wall street the new york times vizualizáció kvant infocult mortgage insurance

Adatvizualizáció: melyik diagramot válasszam?

2009.09.16. 15:41 soobrosa

Nem lehet eléggé fényezni a Juice Analytics arcait, hányszor, de hányszor töprengtem már azon, hogy milyen diagrammal lehet a leghatékonyabban megmutatni valamit - és mennyit káromkodtam utána, hogy az Excelből valami nem teljesen irgalmatlanul rondát csikarjak ki.

Hát tessék, itt a tökéletes megoldás: a Chart Chooser segít a választásban, majd a versenyben maradt példadiagramok template-jét felkínálja letöltésre Excel és Powerpoint(!) formátumban is.

Chart Chooser (Juice Analytics)

Szólj hozzá!

Címkék: adat eszköz excel diagram powerpoint juice vizualizáció

A számok és életünk - júliusi Wired szám

2009.09.15. 13:07 soobrosa

Ha már az idei év úgyis a datageek-ek éve lesz, ne feledkezzünk meg arról, hogy a Wired egy egész számot szentelt az adattémának, alább a talán legérdekesebb cikket az újságból.

Mindenki gyanította, hogy a dinoszauruszok óriási madarak voltak, de amikor egy kutató előállt egy 68 millió éves fehérjével, kritikusai lesöpörték az asztalról: ez csak statisztikai hiba. Persze ő is hibázott, de a végén csak kiderült, hogy neki van igaza, és hogy a biológiában hogyan lesz egyre fontosabb a matematika.

Ratliff: Origin of Species - How a T. Rex Femur Sparked a Scientific Smackdown (Wired)

A Nike rájött, hogy egy Nike+ felhasználónak legalább ötször fel kell töltenie futási eredményeit a webre ahhoz, hogy elkapja őket a gépszíj, és rákattanjanak saját adataikra.

McClusky: The Nike Experiment - How the Shoe Giant Unleashed the Power of Personal Metrics (Wired)

Feltűnt már, hogy a Google és a Facebook küzd az adataidért? Mi a fontosabb, a szociális kontextus vagy az összes többi?

Vogelstein: Great Wall of Facebook - The Social Network's Plan to Dominate the Internet and Keep Google Out (Wired)

Obama CIO-ja tudja, hogy a köz jobb adatvezérelt alkalmazásokat készít majd, mint a kormányzat. Nálunk persze még mindig nem nyilvánosak az állami cégvezetők fizetései (MFB és NIIF NIF itt), és az értünkvannak.hu sem kap adatokat a Parlamentből majd egy éve.

Thompson: And Data for All: Why Obama's Geeky New CIO Wants to Put All Gov't Info Online (Wired)

2 komment

Címkék: google sport wired facebook biológia állam sztori adat szociális obama nike bioinformatika

Daganatos betegségek túlélési aránya

2009.09.09. 09:09 soobrosa

A múlt heti HVG (2009. szeptember 5.) 20. oldalán jelent meg a HVG-ténytárban pár adat és grafikon "Daganatos kórok: nagyobb veszélyben a férfiak?" címmel az Egészségügyi Statisztikai Évkönyv 2007. című kiadvány nyomán.

Alapvetően örülök, hogy a HVG általában igyekszik bennünket, olvasókat, adatokkal kápráztatni, sajnos azonban sokszor nem sikerül konkrétan állítani vagy alátámasztani velük semmit, vagy kicsit hatásvadász módon ábrázolják az adatokat, mint ebben az esetben is: a "Bejelentett rosszindulatú daganatos megbetegedések száma és aránya" diagramm esetén a pár százalékos nemek közötti különbségeket ordenáré tátongó szakadékként jelenítik meg, valahogy így (gyors rekonstrukció).



Ha abszolútértékben ábrázoljuk a számokat, a párszázalékos különbségek nem is olyan rémisztőek.



A szövegben elrejtve megtaláljuk, hogy gond azért van: tízezer férfiből 69-nél, míg tízezer nőből 61-nél találtak daganatos betegséget - a népesség nemek szerinti megoszlása szerint már egészen más a kép, és sajnos nem is változott az elmúlt hat évben.

A témáról eszembe jutott a New York Times nagyszerű infografikája a témában, és a Juice Analytics videótutoriálja arról, hogyan lehet mindezt megvalósítani Excelben. (A módszertan megkérdőjelezhető itt is, hiszen az egy adott évben regisztrált új esetek és az ugyanabban az évben elhaltak számát ábrázolják, ami nem feltétlenül áll szoros kapcsolatban egymással.)

Az Egészségügyi Statisztikai Évkönyv mint közpénzből készülő, közérdekű adatokat tartalmazó kiadvány természetesen ugyanúgy nem férhető hozzá, mint ahogy az MTI hírekért is fizetni kell, node mindegy is, ezt megszoktam már az elmúlt tíz évben. A legutolsó teljes adatkészletet 2004-ből találtam, kicsit kellett persze matekozni, hogy minden rubrikába kerüljön valami, mert részadatok innen-onnan hiányoztak.

Alább a 2004-ben regisztrált új eseteket és az ugyanabban az évben elhaltak számát ábrázoltam.





 

Forrásaim a következő dokumentumok voltak:

(Talán nem is baj, hogy a 2004-es adatokból dolgoztam, mert a KSH Népességstatisztikai főosztálya rámutat arra a "A haláloki statisztika fejlesztése és a változások értékelése" című szüzséjében, hogy 2005-től változott az adatrögzítés módja, ugráltak is kicsit a számok, és arról nem szól a fáma, hogy azóta ez kiegyensúlyozódott-e.)

Szólj hozzá!

Címkék: statisztika halál rák egészség hvg egészségügy adat daganat newyorktimes juice vizualizáció pimpelés

A placebók egyre jobban hatnak

2009.09.07. 20:30 soobrosa

A Wired cikke emlékeztet bennünket arra, hogy csak 1962 óta ellenőrzik az újonnan fejlesztett gyógyszerek hatását úgy, hogy egy kontrollcsoportot placebóval kezelnek, és összehasonlítják a kontrollcsoport javulását az új gyógyszerrel turbózott populáció eredményeivel. De miért csökken a gyógyszeres csoportok és placebós csoportok eredményei között a különbség? A jelenség elképesztő, a gyógyszergyárak talán végre összedobják majd végtelen kutatási adatukat, hogy megértsék, miért van így.

Silberman: Placebos Are Getting More Effective (Wired)

Szólj hozzá!

Címkék: statisztika placebo gyógyszer sztori adat analízis kontrollcsoport

Választási csalók statisztikai kiskátéja

2009.09.04. 19:15 soobrosa

(fotó: Big Picture)

Ha szeretnéd meghamisítani választási eredményeid, mindenképpen vigyázz arra, hogy mi, átlagemberek igen rosszul gyártunk véletlennek tűnő számsorokat. Ha sok részeredményt állítasz elő egy íróasztal mellett, ellenőrizd az utolsó számjegyek statisztikai eloszlását, különben kibújik a szög a zsákból. (A durvulás a kommentekben csak a kemény magnak.)

Beber-Scacco: The Devil Is in the Digits (Washington Post via FlowingData)

Szólj hozzá!

Címkék: statisztika választás irán sztori adat csalás

Miért éppen Adatkelet?

2009.09.02. 09:02 soobrosa

"A francnak a matek, mire mentem a másodfokú egyenlet megoldóképletével, a közgázon meg analízissel szórtak első éven, aztán deriválással se sokat csajoztam/fasziztam" - azt hiszem ez még egy barátságos, de általánosan lesújtó vélemény a valahogy mégis minden rendszer és jelenség mögött érthetetlenül lakozó absztrakt hókuszpókuszra.

Nekem mázlim volt, én se mentem semmire az analízissel, de legalább élveztem, amikor rájöttem és megértettem, hála a specmateknak és tanárainknak, így legalább az én lesújtó véleményem csak a feslőoktatásban (copyright Ficere) bukkant ki, amikor a szórótárgynál szembesültem azzal, hogy egészen más szeretkezni, mint gyorstekercselve pornófilmet nézni. A tuti mindkettőben ugyanaz, de valahogy a lényeg elmarad.

Arthur Benjamin amellett tör pálcát, hogy az analóg világ ipari mérnökei miatt rendeltük alá a komplett matematikaoktatást az analízisnek, és ennek az ideje már lejárt. Talán nem késő még, hogy infoszennyezett, adattúltengéses világunkban a statisztikát erőltessük a fejekbe - legalább a szerencsejáték bizniszt megrengethetjük egy kicsit. :)

Nézzetek videót, van magyar felirata is.

Szólj hozzá!

Címkék: statisztika matek adat analízis kalkulus

süti beállítások módosítása