Låt oss kolla på skillnaden mellan data mining och datalagring med hjälp av ett jämförelseskartong som visas nedan.
Jämförelsediagram
Grunder för jämförelse | Data Mining | Datalagring |
---|---|---|
Grundläggande | Data mining är en process för att hämta eller extrahera meningsfulla data från databas- / datalagret. | Data warehouse är ett förråd där informationen från flera källor lagras under ett enda schema. |
Definition av data mining
Data Mining är en process för att upptäcka kunskap, som du aldrig förväntade dig att finnas i din databas . Med hjälp av traditionella sökverktyg kan du bara hämta den kända informationen från data. Men Data Mining ger dig möjlighet att hämta dold information ut ur data . Data mining extraherar meningsfull information från databasen som kan användas för beslutsfattande .
Kunskapsfunnet i databaser, som kallas KDD, uppvisar förhållande och mönster . Relationen kan vara mellan två eller flera olika objekt, mellan attribut för samma objekt. Mönster är ett annat resultat av data mining som visar den regelbundna och förståeliga sekvensen av information som bidrar till beslutsfattandet.
Stegen involverad i KDD, dvs Knowledge Discovery i databaser kan sammanfattas som första, urval av dataset där datautvinning måste utföras. Nästa är förbehandling som innebär borttagning av inkonsekventa data. Därefter kommer datatransformation där data omvandlas till den form som är lämplig för data mining. Nästa är datautvinning, här appliceras data mining algoritmerna till data. Och slutligen, tolkning och utvärdering som innebär att extrahera förhållandet eller mönstret bland data.
Data mining passar bra i datalagringsmiljön som har lagrat data på ett aggregerat och sammanfattat sätt. Eftersom det blir lätt att mina data i datalager
Definiera datalagring
Data Warehouse är en central plats där information som samlas in från flera källor lagras under ett enda enhetligt schema . Uppgifterna samlas in i första hand, olika företagskällor, städas och transformeras och lagras i ett datalager. När data har lagts in i ett datalagringshus, förblir det länge kvar och kan man få tillgång till övertid.
Data Warehouse är en perfekt blandning av teknik som datamodellering, datainsamling, datahantering, metadatahantering, hanteringsverktyg för hantering av utvecklingsverktyg . Alla dessa tekniker stöder funktioner som datautvinning, datatransformering, datalagring, vilket ger användargränssnitt för åtkomst till data .
Datalager är inte en produkt eller programvara, det är en informativ miljö som ger information som en integrerad syn på ett företag. Du kan få åtkomst till företagets nuvarande och historiska data som bidrar till beslutsfattandet. Den stöder transaktioner som görs för beslutsfattande utan att påverka operativsystemen. Det är en flexibel resurs för att få strategisk information.
Viktiga skillnader mellan data mining och datalagring
- Det finns en grundläggande skillnad som skiljer data mining och datalagring som är datautvinning är en process för att extrahera meningsfulla data från den stora databasen eller datalagret. Datalagret ger emellertid en miljö där data lagras i en integrerad form som underlättar datautvinning för att extrahera data mer effektivt.
Slutsats:
Data Mining kan endast göras när det finns en väl integrerad stor databas, dvs datalager. Så datalagret måste vara klart innan data mining. Datalagret måste ha information i välintegrerad form så att datautvinning kan utvinna kunskapen på ett effektivt sätt.