Práce s daty je jako taneční - musíte pracovat s tím, co zrovna máte

Rozhovor s Michaelou Modálkovou, výkonnou ředitelkou společnosti StatSoft (Dell Software Group)

12.8.2014 - Doporučujeme

 

O čem si dnes budeme povídat?

O datech, jejich přínosech a možnostech účelného využití.

Naše společnost StatSoft, která na českém a slovenském trhu působí už od roku 1999, totiž vyvíjí k jejich analýze statistický nástroj STATISTICA, jenž dokáže z dat dostávat užitečné informace a pomoci tím organizacím v jejich dalším fungování. Dá se tak s úspěchem tvrdit, že vaše data mohou vydělávat, jen je potřeba vědět, jak s nimi zacházet.

K čemu nám data tedy mohou sloužit, pomineme-li jejich prostou roli zdroje informací o nějakém jevu?

Naopak, tato role není prostá, ale hlavní. Data jsou a vždy budou zdrojem informací. To, čím se od sebe však liší, je jejich informační hodnota, kterou můžeme získat.

Vlastní přínos dat záleží totiž na dvou aspektech. Za prvé na tom, jaká data a jak často ukládáme. A za druhé, jak dobře je umíme vyhodnotit. A to je právě naše parketa. Vy sice můžete data sbírat a ukládat, ale velké a složité datové soubory vám samy o sobě nic neřeknou. Vše totiž záleží na vaší schopnosti je vyhodnotit, nebo zanalyzovat chcete-li, a získat z nich co nejvíce podstatných informací, které vám budou k užitku. Samotný přínos pak může být velmi široký a záleží na konkrétním požadavku – úspora nákladů, zefektivnění prodeje, optimalizace procesů a další.

Domníváte se, že organizace v současné době nakládají s daty efektivně?

To nelze shrnou jednou větou, neboť zde existují velké rozdíly v rámci jednotlivých trhů. Velké finanční společnosti mají oblast analýzy dat na vysoké úrovni, ale i zde nalezneme odlišnosti.

Také například v oblasti průmyslu existují společnosti, které jsou na úplném začátku, co se práce s daty týče, zatímco jiné jsou již daleko vpředu a dokáží efektivně zužitkovat množství informací, které se jim podaří shromáždit. Prostor pro zlepšení je ale napříč všemi tržními segmenty.

Co činí organizacím největší problémy?

Z našich zkušeností se setkáváme se dvěma nejčastějšími.

První problém spočívá v neznalosti toho, co vše je možné z dat získat za informace a co mohou businessu přinést v širším důsledku. Zkrátka organizace nehledí na to, že analýzou svých dat by organizace dokázaly lépe odhadovat budoucí vývoj, kterému by se mohly lépe a včasně přizpůsobit.

Pokud se bavíme o společnostech, které potřebují získat z vlastních dat co nejvíce informací a existuje, respektive je známý i cíl analýzy, pak hraje důležitou roli zejména příprava dat pro vyhodnocení, která je často nedostatečná, čímž vlastně můžeme pojmenovat druhý problém.

Data bývají mnohdy v různých systémech (účetních, CRM) a je třeba využít je všechna, konsolidovat je. Samotná příprava dat je obecně jednou z nejnáročnějších úloh v celé analýze, nicméně spousta postupů se dá automatizovat a tudíž i tento krok se dá zefektivnit.

Zcela jiná situace je v oblasti výzkumu (farmacie a zdravotnictví), kde se neustále něco vyhodnocuje. Avšak zde často chybí zase správné know-how, jak data vyhodnocovat takovým způsobem, aby výstupy splňovaly všechny náležitosti odborné studie.

Mluvila jste o přípravě dat. Existuje něco jako „špatná“ data, která nám nejsou k užitku?

Samozřejmě, že existují data, která jsou nepřesně měřena nebo data, ve kterých je velké množství chybějících hodnot. Jako taková samozřejmě poskytují omezenější a mnohdy nekompletní informace.

Další problémem jsou také data, která jsou neaktuální, zastaralá. Tedy data získaná například od neaktivních zákazníků, špatných kontaktů, na bázi původních cen apod.

Naši analytici však pracují i s těmito daty. Existují totiž různé techniky, jak je upravit a zvýšit tím jejich hodnotu. Vždy je třeba si nějak poradit. To máte stejné jako v tanečních. Na první hodině nám bylo řečeno: „Dámy, musíte pracovat s tím, co máte…“

Můžete blíže popsat analytický nástroj STATISTICA, který vaše společnost, původem z USA, vyvíjí?

STATISTICA je analytický nástroj, který je určen k analýze dat, o nichž se zde bavíme, a to jakýchkoliv dat. Každý obor má ale jinou povahu, a tak i ukládaná data se liší podle jejich zaměření. Je to vlastně softwarový produkt se širokým záběrem, který dokáže vyhodnocovat data ze všech oblastí lidské činnosti. Prodáváme ho po modulech a naši zákazníci si kupují pouze ty balíčky, které ve své konkrétní praxi skutečně využijí.

A když už jsme u toho využití. Například v oblasti obchodu je jedním z hlavních cílů identifikace nových obchodních příležitostí, ať už formou oslovení nových klientů, nebo vylepšením produktu pro ty stávající. Informace o chování zákazníků, o jejich potřebách a tendencích je uložena právě v datech a dobře zpracované výstupy jsou pak základním vstupem pro tvorbu kvalitních marketingových strategií.

Představte si, že ale nepůjde zrovna o obchod, ale o záchranu lidského života, třeba novorozence v intenzivní péči, kterému každá nesprávně odměřená dávka léků může velmi ublížit. O kolik by se snížilo riziko úmrtí optimalizováním dávkování léků na základě vyhodnocení dat z předchozí léčby? A kolik léčiva se tím ušetří a může tak zachránit i další pacienty?

Obecně výsledky analýz, ať už z jakékoli oblasti, slouží pro podporu různých druhů rozhodování – o obchodu, o pacientovi, o tom jestli je jeden materiál lepší nebo horší než jiný apod. Zkrátka bez těchto datových podkladů se dnes prakticky neobejde žádné manažerské rozhodnutí.

Co je nutné vědět ještě předtím, než data do softwaru STATISTICA načteme?

Měli bychom jasně vědět, co chceme.

Stejně jako když například načítám dokument ve Wordu, tak už předem vím, že budu chtít měnit formátování, provádět revizi nebo dopisovat text. Zde bych měla tedy znát základní cíl analýzy. To znamená, jestli chci provádět vizualizaci dat, počítat sumarizační charakteristiky, určovat dlouhodobý vývoj produktu či poptávky, odhadovat odchod zákazníka ze společnosti, hledat závislosti mezi léčbou a stavem pacienta apod.

V současnosti je v analýze dat populární metodologie neuronových sítí. Čeho je s její pomocí teoreticky možné dosáhnout?

Neuronové sítě jsou neuvěřitelný algoritmus, který napodobuje činnost lidského mozku, a našel si využití napříč obory lidské činnosti. Jejich velmi kvalitní a vysoce hodnocenou schopností je předpověď nějakého budoucího stavu - poptávky, návštěvnosti webu nebo třeba schopnosti klienta splácet úvěr.

Například ve společnosti Unipetrol je pomocí neuronové sítě neustále předpovídán stav vyráběného ropného produktu. Díky tomuto algoritmu má pak firma přesné odhady toho, co se s produktem děje, a nemusí tudíž čekat na výsledky laboratorních testů, které jsou zdlouhavé. Finanční přínos je obrovský.

I kdybyste vyráběli třeba limonádu a na monitoru se vám, díky neuronové síti, objeví informace o tom, že složení neodpovídá požadovanému stavu, můžete provést úpravu ihned - přidáte více cukru nebo šťávy a podobně. Pokud ale budete mít výsledky o složení vyrobené limonády až po několika hodinách, množství špatně vyrobené limonády, kterou budete muset odepsat, bude podstatně větší.

Vaše klienty učíte se systémem STATISTICA pracovat a pořádáte za tímto účelem různé kurzy. Je systém tak náročný na pochopení, že prostá metoda pokus – omyl zkrátka nestačí?

Základní orientace není náročná. Ovládání softwaru STATISTICA připomíná produkty Microsoft Excel. Pokud někdo ví, co chce, tak zpravidla nemá problém se zorientovat a na naše kurzy tudíž nepřijde, anebo si přijde ujasnit pouze nějaké detaily.

Na našich kurzech se však neučí pouze práce se softwarem, ale především know-how o zpracování dat, neboť, jak jsem již naznačila, zpracování dat se liší podle oblastí lidské činnosti. Kurzy jsou mixem teoretických znalostí a ovládání softwaru na příkladech z praxe. 

U nových větších klientů jsou přesto velmi oblíbené úvodní kurzy ovládání softwaru a to zejména proto, že budoucí uživatelé mají často rozdílné počítačové dovednosti a tyto schopnosti se kurzem sjednotí. Praxe ukazuje, že tato forma zaučení je navíc časově nejefektivnější.

Pro ty, kteří mají zájem se zúčastnit některého ze zmíněných školení, je možné si vybrat z aktuálního kalendáře kurzů.

Můžete na závěr uvést ještě nějaké příklady z vaší praxe, kdy se komplexní systemizovaná analýza dat skutečně nějaké organizaci vyplatila?        

Kromě Unipetrolu, kde analýza dat šetří velké finanční částky, můžeme zmínit například i Českou Kancelář Pojistitelů, která je naším významným klientem a velmi úspěšně předpovídá v našem softwaru budoucí náklady na léčebné výlohy zraněných při dopravní nehodě. To pak má vliv na efektivní hospodaření s finančními prostředky u jednotlivých pojišťoven, které díky tomu mohou lépe odhadovat rozpočet pro pojistné plnění v budoucím období.

Příkladem ale také může být naše praxe ze společnosti EOS, kde na základě dat předpovídáme schopnost úspěšného vymožení pohledávky a výsledkem doplňujme expertní pravidla a zkušenosti. Opět jde o efektivní nakládání se zdroji.

Komerční bance pak software STATISTICA využívá oddělení Řízení rizik pro odhad kreditního rizika u klientů.

Příkladů využití této systemizované analýzy dat bychom nalezli mnoho a v každé z oblastí má své specifické uplatnění napomáhající zkvalitnění či zefektivnění určitých procesů.

 

Michaela Modálková vystudovala gymnázium a začala též studia MBA programu. Svou školu života však absolvovala až v různých firmách zabývajících se prodejem a distribucí počítačové techniky. Zde zastávala řadu pozic včetně vedoucích manažerských funkcí a pomáhala budovat a rozvíjet jednotlivá oddělení i celou společnost. Od roku 2009 je výkonnou ředitelkou českého zastoupení americké společnosti StatSoft, která se zabývá statistickou analýzou dat a vyvinula analytický systémový nástroj STATISTICA. Společnost StatSoft se od září 2014 stává součástí Dell Software Group. Ve volném čase jezdí automobilové orientační soutěže a deset let vedla dětskou taneční skupinu zaměřenou na step a westernový show dance, se kterou získala několik titulů mistrů republiky. Kromě toho se věnuje také rodině a své malé vnučce.

Michaela Modálková - výkonná ředitelká společnosti StatSoft


Tento rozhovor byl připraven ve spolupráci s firmou:



Další informace Vám rádi poskytneme prostřednictvím EduCity, prosíme kontaktujte p. Bartičku info@educity.cz nebo na tel. (+420) 731 169 890

Vytisknout rozhovor