Business intelligence og analyse

Analyse og business intelligence blir som regel knyttet opp mot et gap mellom nåværende situasjon og et mål. For å begynne å analysere dette problemet, velger vi en eller flere datavariabler som viser situasjonen.

Med sql eller data integration-verktøy henter vi fram data for populasjonen og variablene vi ønsker å undersøke.

Visualisere
Neste steg er å visualisere variablene av interesse. For noen datasett gir det innsikt å plotte variabelen over tid. For eksempel kan vi sette salg på Y-aksen og måned på X-aksen. I andre visualiseringer setter vi den avhengige variabeln på Y og uavhengige på X for å oppdage mønster. Krysstabeller kan gi en indikasjon på korrelasjon og kausalitet. Korrelasjonskoeffisienter vil oppdage lineære sammenhenger mellom variabler. Vi vil også se på gjennomsnitt, standardavvik, maks og min.

Bayesian network

Open source applikasjon for bayesian nettverk med data fra et Coursera Big Data and Web Analytics-kurs.

Tenke
Basert på den initielle undersøkelsen av hvordan de viktigste variablene oppfører seg, vil vi tenke gjennom hvilke andre variabler som kan være årsaker og hva slags verktøy som kan identifisere disse. Enkel regresjon kan være en metode. Stianalyse med kjeder av flere variabler, beslutningstrær, bayesiske nettverk, clustering eller kausale løkkediagram er andre muligheter. På dette tidspunktet må vi også reflektere mer over problemet eller utfordringen, hvor verdifull innsikt fra ytterligere analyse kan være og i hvilke beslutninger den vil bli brukt. De initielle funnene kan være alt vi trenger for å gjennomføre eksperimenter med variabler som vi antar er de avgjørende faktorene. Slike eksperimenter vil generere nye data som vi kan analysere videre.

Online analytical processing

OLAP-tabell (Online analytical processing) der data for Google Preview (snapshots) er hentet fram.