Gegevensanalyse is het proces van het evalueren van gegevens met behulp van analytische en statistische hulpmiddelen om nuttige informatie te vinden en te helpen bij het nemen van zakelijke beslissingen. Er zijn verschillende methoden voor gegevensanalyse, waaronder data mining, tekstanalyse, business intelligence en datavisualisatie.
Hoe wordt gegevensanalyse uitgevoerd?
Gegevensanalyse is onderdeel van een groter proces van het afleiden van business intelligence. Het proces omvat een of meer van de volgende stappen:
- Doelstellingen definiëren: elke studie moet beginnen met een reeks duidelijk gedefinieerde bedrijfsdoelstellingen. Veel van de beslissingen die in de rest van het proces worden genomen, zijn afhankelijk van hoe duidelijk de doelstellingen van het onderzoek zijn verklaard.
- Vragen stellen: er wordt een poging gedaan om een vraag te stellen in het probleemdomein. Gaan rode sportwagens bijvoorbeeld vaker in ongelukken dan anderen?
- Gegevensverzameling: Gegevens die relevant zijn voor de vraag moeten worden verzameld bij de juiste bronnen. In het bovenstaande voorbeeld kunnen gegevens worden verzameld uit verschillende bronnen, waaronder: DMV- of politie-ongevalsrapporten, verzekeringsclaims en gegevens over ziekenhuisopname. Wanneer gegevens worden verzameld met surverys, is een vragenlijst nodig die aan de proefpersonen moet worden voorgelegd. De vragen moeten op de juiste manier worden gemodelleerd voor de gebruikte statistische methode.
- Data Wrangling: onbewerkte gegevens kunnen in verschillende indelingen worden verzameld. De verzamelde gegevens moeten worden opgeschoond en geconverteerd zodat gegevensanalysetools deze kunnen importeren. Voor ons voorbeeld kunnen we DMV-ongevalsrapporten ontvangen als tekstbestanden, verzekeringsclaims van een relationele database en ziekenhuisgegevens als een API. De gegevensanalist moet deze verschillende gegevensvormen samenvoegen en omzetten in een vorm die geschikt is voor de analysehulpmiddelen.
- Gegevensanalyse: dit is de stap waarbij de opgeschoond en geaggregeerde gegevens worden geïmporteerd in analysehulpmiddelen. Met deze hulpmiddelen kunt u de gegevens verkennen, patronen erin zoeken en vragen over wat als 'vragen' stellen. Dit is het proces waarbij betekenis wordt gegeven aan gegevens die zijn verzameld in onderzoek door de juiste toepassing van statistische methoden.
- Conclusies opstellen en voorspellingen doen: dit is de stap waar, na voldoende analyse, conclusies kunnen worden getrokken uit de gegevens en gepaste voorspellingen kunnen worden gedaan. Deze conclusies en voorspellingen kunnen dan worden samengevat in een rapport aan eindgebruikers.
Laten we nu eens in detail kijken naar de methoden van data-analyse in het bijzonder.
Data Mining
Datamining is een methode voor data-analyse voor het ontdekken van patronen in grote gegevenssets met behulp van de methoden Hoe word ik een datawetenschapper Hoe word ik een datawetenschapper Datakunde is van een nieuw bedachte term in 2007 uitgegroeid tot een van de meest gewilde disciplines vandaag. Maar wat doet een data-wetenschapper? En hoe kun je in het veld breken? Lees meer over statistieken, kunstmatige intelligentie, machine learning en databases. Het doel is om onbewerkte gegevens om te zetten in begrijpelijke bedrijfsinformatie. Deze kunnen het identificeren van groepen gegevensrecords (ook bekend als clusteranalyse) of het identificeren van anomalieën en afhankelijkheden tussen gegevensgroepen omvatten.
Toepassingen van datamining:
- Anomoliedetectie kan enorme hoeveelheden gegevens verwerken ("big data") en automatisch uitbijtergevallen identificeren, mogelijk voor uitsluiting van besluitvorming of detectie van fraude (bijv. Bankfraude).
- Leren koopgewoonten van klanten. Machinaal leren technieken kunnen worden gebruikt om klant koopgedrag te modelleren en vaak gekochte items te bepalen.
- Clustering kan voorheen onbekende groepen binnen de gegevens identificeren.
- Classificatie wordt gebruikt om gegevensinvoeren automatisch in vooraf gespecificeerde laden te classificeren. Een bekend voorbeeld is het classificeren van e-mailberichten als "spam" of "niet-spam" en het systeem leren van de gebruiker.
Tekstanalyse
Tekstanalyse is het proces waarbij nuttige informatie uit tekst wordt afgeleid. Het wordt bereikt door ongestructureerde tekstuele informatie te verwerken, zinvolle numerieke tijd uit te sparen met tekstbewerkingen in Excel Tijd besparen met tekstbewerkingen in Excel Excel kan magie met getallen doen en het kan evengoed karakters aan. Deze handleiding laat zien hoe u tekst in spreadsheets kunt analyseren, converteren, vervangen en bewerken. Met deze basisprincipes kunt u complexe transformaties uitvoeren. Lees Meer indices van de informatie en maak de informatie beschikbaar voor statistische en machine learning-algoritmen voor verdere verwerking.
Het tekstmijnproces omvat een of meer van de volgende stappen:
- Informatie verzamelen uit verschillende bronnen, waaronder web, bestandssysteem, database, enz.
- Taalkundige analyse inclusief verwerking van natuurlijke taal.
- Patroonherkenning (bijv. Herkennen van telefoonnummers, e-mailadressen, etc.)
- Het extraheren van beknopte informatie uit de tekst, zoals relatieve frequenties van de woorden, het bepalen van overeenkomsten tussen documenten, enz.
Voorbeelden van toepassingen voor tekstanalyse:
- Analyse van open antwoorden op enquêtes. Deze enquêtes zijn verkennend van aard en bevatten open vragen met betrekking tot het onderwerp in kwestie. De respondenten kunnen vervolgens hun mening geven zonder te worden beperkt tot een bepaald antwoordformaat.
- Analyse van e-mails, documenten, enz. Om "rotzooi" uit te filteren. Dit omvat ook automatische classificatie van berichten in vooraf gedefinieerde bakken voor routering naar verschillende afdelingen.
- Onderzoek concurrenten door hun websites te crawlen. Dit kan worden gebruikt om informatie over activiteiten van concurrenten af te leiden.
- Beveiligingstoepassingen die logbestanden kunnen verwerken voor inbraakdetectie.
Business Intelligence
Bedrijfsinformatie Cortana gebruiken om gegevens te analyseren met Power BI Cortana gebruiken om gegevens te analyseren met Power BI Eager om uw gegevensanalyse te vereenvoudigen? Krijg snel antwoord van Cortana met deze gids. Read More transformeert gegevens in bruikbare informatie voor zakelijke doeleinden en kan worden gebruikt in de strategische en tactische zakelijke besluitvorming van een organisatie. Het biedt een manier voor mensen om trends uit verzamelde gegevens te onderzoeken en hieruit inzichten te ontlenen.
Enkele voorbeelden van business intelligence die vandaag de dag worden gebruikt:
- De operationele beslissingen van een organisatie, zoals productplaatsing en prijsbepaling.
- Identificatie van nieuwe markten, beoordeling van de vraag en geschiktheid van producten voor verschillende marktsegmenten.
- Budgettering en voortschrijdende prognoses.
- Visuele hulpmiddelen gebruiken zoals warmtekaarten, draaitabellen en geografische kaarten.
Data visualisatie
Datavisualisatie Visualiseer onmiddellijk gegevens en informatie met Google Fusion Tables Visualiseer onmiddellijk gegevens en informatie met Google Fusion Tables Of u nu een rapport voor werk samenstelt, of u wilt eenvoudig informatie op uw blog grafisch weergeven, Google Fusion Tables kan helpen. Google Fusion is eigenlijk een ingebouwde functie in ... Lees meer verwijst heel eenvoudig naar de visuele weergave van gegevens. In de context van data-analyse betekent dit dat de tools van statistieken, waarschijnlijkheid, draaitabellen en andere artefacten worden gebruikt om gegevens visueel weer te geven. Het maakt complexe gegevens begrijpelijker en bruikbaarder.
Toenemende hoeveelheden gegevens worden gegenereerd door een aantal sensoren in de omgeving (aangeduid als "Internet of Things" of "IOT"). Deze gegevens (ook wel "big data" genoemd) vormen een uitdaging voor het begrip die kan worden vereenvoudigd door gebruik te maken van de tools voor datavisualisatie. Gegevensvisualisatie wordt gebruikt in de volgende toepassingen.
- Samenvattingsgegevens extraheren uit de onbewerkte gegevens van IOT.
- Een staafdiagram gebruiken om de verkoopprestaties over meerdere kwartalen weer te geven.
- Een histogram toont de verdeling van een variabele zoals inkomen door het bereik te verdelen in bakken.
Gegevensanalyse in beoordeling
Gegevensanalyse wordt gebruikt om gegevens te evalueren met statistische hulpmiddelen om nuttige informatie te vinden. Hiervoor worden verschillende methoden gebruikt, waaronder datamining, tekstanalyse, business intelligence en gegevensvisualisatie.
Heeft u data-analyse in uw organisatie gebruikt om alles te modelleren? Hoe was je ervaring? Heeft u nuttige inzichten te bieden? Laat het ons weten in de comments hieronder.