Die Grundlage der vierten industriellen Revolution wird weitgehend von Daten^(Data) und Konnektivität^{(Connectivity)} abhängen . Analysis Services , die in der Lage sind, Data-Mining-Lösungen zu entwickeln oder zu erstellen, werden dabei eine Schlüsselrolle spielen. Es könnte bei der Analyse und Vorhersage der Ergebnisse des Kaufverhaltens von Kunden helfen, um potenzielle Käufer anzusprechen. Daten^(Data) werden zu einer neuen natürlichen Ressource, und der Prozess des Extrahierens relevanter Informationen aus diesen unsortierten Daten wird eine immense Bedeutung erlangen. Daher könnte uns ein richtiges Verständnis des Begriffs Data Mining , seiner Prozesse und Anwendung dabei helfen, einen ganzheitlichen Ansatz für dieses Schlagwort zu entwickeln.

Data Mining-Grundlagen^{(Data Mining Basics)} und ihre Techniken

Data-Mining

Beim Data Mining, auch bekannt als Knowledge Discovery in Data ( KDD ), geht es darum, große Datenbestände zu durchsuchen, um Muster und Trends aufzudecken, die über eine einfache Analyse hinausgehen. Dies ist jedoch keine einstufige Lösung, sondern ein mehrstufiger Prozess und wird in mehreren Stufen abgeschlossen. Diese beinhalten:

1] Datenerhebung und -aufbereitung

Es beginnt mit der Datenerhebung und deren ordnungsgemäßer Organisation. Dies trägt dazu bei, die Chancen, die Informationen zu finden, die durch Data Mining entdeckt werden können, erheblich zu verbessern

2] Modellbildung und -evaluierung

Der zweite Schritt im Data-Mining-Prozess ist die Anwendung verschiedener Modellierungstechniken. Diese werden verwendet, um die Parameter auf optimale Werte zu kalibrieren. Die eingesetzten Techniken hängen weitgehend von den analytischen Fähigkeiten ab, die erforderlich sind, um eine Reihe von organisatorischen Anforderungen zu erfüllen und zu einer Entscheidung zu gelangen.

Lassen Sie uns kurz einige Data-Mining-Techniken untersuchen. Es hat sich gezeigt, dass die meisten Organisationen zwei oder mehr Data-Mining-Techniken miteinander kombinieren, um einen geeigneten Prozess zu bilden, der ihre Geschäftsanforderungen erfüllt.

Lesen Sie^(Read) : Was ist Big Data?^{(What is Big Data?)}

Data-Mining-Techniken

Assoziation – ^{(Association – )}Assoziation^{(Association)} ist eine der weithin bekannten Data-Mining-Techniken. Dabei wird ein Muster basierend auf einer Beziehung zwischen Artikeln in derselben Transaktion entschlüsselt. Daher^(Hence) wird sie auch als Relationentechnik bezeichnet. Große Markeneinzelhändler verlassen sich auf diese Technik, um die Kaufgewohnheiten/Präferenzen ihrer Kunden zu erforschen. Bei der Verfolgung der Kaufgewohnheiten von Menschen könnten Einzelhändler beispielsweise feststellen, dass ein Kunde immer Sahne kauft, wenn er Schokolade kauft, und daher vorschlagen, dass er beim nächsten Schokoladenkauf vielleicht auch Sahne kaufen möchte.
Klassifizierung^{(Classification)} – Diese Data-Mining-Technik unterscheidet sich von der oben genannten in der Art und Weise, dass sie auf maschinellem Lernen basiert und mathematische Techniken wie lineare^(Linear) Programmierung, Entscheidungsbäume^(Decision) , Neural verwendet^(Neural)Netzwerk. Bei der Klassifizierung versuchen Unternehmen, Software zu entwickeln, die lernen kann, die Datenelemente in Gruppen zu klassifizieren. Beispielsweise kann ein Unternehmen im Antrag eine Klassifizierung definieren, die „angesichts aller Aufzeichnungen von Mitarbeitern, die angeboten haben, aus dem Unternehmen auszuscheiden, die Anzahl der Personen vorhersagt, die wahrscheinlich in Zukunft aus dem Unternehmen ausscheiden werden“. In einem solchen Szenario kann das Unternehmen die Aufzeichnungen von Mitarbeitern in zwei Gruppen einteilen, nämlich „verlassen“ und „bleiben“. Es kann dann seine Data-Mining-Software verwenden, um die Mitarbeiter in zuvor erstellte separate Gruppen einzuteilen.
Clustering – Anders^(Different)Objekte mit ähnlichen Merkmalen werden durch Automatisierung in einem einzigen Cluster zusammengefasst. Viele solcher Cluster werden als Klassen erstellt und Objekte (mit ähnlichen Eigenschaften) werden entsprechend darin platziert. Um dies besser zu verstehen, betrachten wir ein Beispiel für die Buchverwaltung in der Bibliothek. In einer Bibliothek ist die riesige Sammlung von Büchern vollständig katalogisiert. Artikel des gleichen Typs werden zusammen aufgelistet. Dies erleichtert uns die Suche nach einem Buch, das uns interessiert. In ähnlicher Weise können wir mit der Clustering-Technik Bücher, die gewisse Ähnlichkeiten aufweisen, in einem Cluster halten und ihm einen geeigneten Namen zuweisen. Wenn ein Leser also nach einem für ihn relevanten Buch sucht, muss er nur zu diesem Regal gehen, anstatt die gesamte Bibliothek zu durchsuchen. Somit definiert die Clustering-Technik die Klassen und fügt Objekte in jede Klasse ein,
Vorhersage^(Prediction) – Die Vorhersage ist eine Data-Mining-Technik, die häufig in Kombination mit anderen Data-Mining-Techniken verwendet wird. Es beinhaltet die Analyse von Trends, Klassifizierung, Musterabgleich und Beziehung. Durch die Analyse vergangener Ereignisse oder Instanzen in einer richtigen Reihenfolge kann man ein zukünftiges Ereignis sicher vorhersagen. Beispielsweise kann die Vorhersageanalysetechnik beim Verkauf verwendet werden, um den zukünftigen Gewinn vorherzusagen, wenn der Verkauf als unabhängige Variable und der Gewinn als eine vom Verkauf abhängige Variable gewählt wird. Dann kann man basierend auf den historischen Verkaufs- und Gewinndaten eine angepasste Regressionskurve zeichnen, die für die Gewinnprognose verwendet wird.
Entscheidungsbäume^{(Decision trees)} – Innerhalb des Entscheidungsbaums beginnen wir mit einer einfachen Frage, die mehrere Antworten hat. Jede Antwort führt zu einer weiteren Frage, die dabei hilft, die Daten zu klassifizieren oder zu identifizieren, damit sie kategorisiert werden können oder damit basierend auf jeder Antwort eine Vorhersage getroffen werden kann. Zum Beispiel verwenden wir den folgenden Entscheidungsbaum, um zu bestimmen, ob Cricket gespielt werden soll oder ^{(Data Mining Decision Tree)}nicht^(ODI) . Alternativ, wenn die Wettervorhersage klar ist, sollten wir das Spiel spielen.

Data Mining steht im Mittelpunkt der Analysebemühungen in einer Vielzahl von Branchen und Disziplinen wie Kommunikation, Versicherungen^(Insurance) , Bildung^(Education) , Fertigung^{(Manufacturing)} , Banken^(Banking) und Einzelhandel^(Retail) und mehr. Daher ist es wichtig, die richtigen Informationen darüber zu haben, bevor Sie die verschiedenen Techniken anwenden.

What is Data Mining? Basics and its Techniques.

The foundation of the foυrth industrial revоlution will largely dеpend upon Data and Connectivity. Analysis Services capable of developing or creating data mining solutions will play a key role in this regard. It could assist in analyzing and predicting outcomes of customer purchasing behavior for targeting potential buyers. Data will become a new natural resource and the process of extracting relevant information from this unsorted data will assume immense importance. As such, a proper understanding of the term – Data Mining, its processes, and application could help us in developing a holistic approach to this buzzword.

Data Mining Basics and its Techniques

data mining

Data mining, also known as Knowledge Discovery in Data (KDD) is about searching large stores of data to uncover patterns and trends that go beyond simple analysis. This, however, is not a single-step solution but a multi-step process and is completed in various stages. These include:

1] Data gathering and Preparation

It starts with data collection and its proper organization. This helps in significantly improving the chances of finding the information that can be discovered through data mining

2] Model Building and Evaluation

The second step in data mining process is the application of various modeling techniques. These are used to calibrate the parameters to optimal values. Techniques employed largely depend on analytic capabilities required to address a gamut of organizational needs and to arrive at a decision.

Let us examine some data mining techniques in brief. It is found that most organizations combine two or more data mining techniques together to form an appropriate process that meets their business requirements.

Read: What is Big Data?

Data Mining Techniques

Association – Association is one of the widely-known data mining techniques. Under this, a pattern is deciphered based on a relationship between items in the same transaction. Hence, it is also known as the relation technique. Big brand retailers rely on this technique to research customer’s buying habits/preferences. For example, when tracking people’s buying habits, retailers might identify that a customer always buys cream when they buy chocolates, and therefore suggest that the next time that they buy chocolates they might also want to buy cream.
Classification – This data mining technique differs from the above in the way that it is based on machine learning and uses mathematical techniques such as Linear programming, Decision trees, Neural network. In classification, companies try to build software that can learn how to classify the data items into groups. For instance, a company can define a classification in the application that “given all records of employees who offered to resign from the company, predict the number of individuals who are likely to resign from the company in future.” Under such a scenario, the company can classify the records of employees into two groups that namely “leave” and “stay”. It can then use its data mining software to classify the employees into separate groups created earlier.
Clustering – Different objects exhibiting similar characteristics are grouped together in a single cluster via automation. Many such clusters are created as classes and objects (with similar characteristics) are placed in it accordingly. To understand this better, let us consider an example of book management in the library. In a library, the vast collection of books is fully cataloged. Items of the same type are listed together. This makes it easier for us to find a book of our interest. Similarly, by using the clustering technique, we can keep books that have some kinds of similarities in one cluster and assign it a suitable name. So, if a reader is looking to grab a book relevant to his interest, he only has to go to that shelf instead of searching the entire library. Thus, the clustering technique defines the classes and puts objects in each class, while in the classification techniques, objects are assigned into predefined classes.
Prediction – The prediction is a data mining technique that is often used in combination with the other data mining techniques. It involves analyzing trends, classification, pattern matching, and relation. By analyzing past events or instances in a proper sequence one can safely predict a future event. For instance, the prediction analysis technique can be used in the sale to predict future profit if the sale is chosen as an independent variable and profit as a variable dependent on sale. Then, based on the historical sale and profit data, one can draw a fitted regression curve that is used for profit prediction.
Decision trees – Within the decision tree, we start with a simple question that has multiple answers. Each answer leads to a further question to help classify or identify the data so that it can be categorized, or so that a prediction can be made based on each answer. For example, We use the following decision tree to determine whether or not to play cricket ODI: Data Mining Decision Tree: Starting at the root node, if the weather forecast predicts rain then, we should avoid the match for the day. Alternatively, if the weather forecast is clear, we should play the match.

Data Mining is at the heart of analytics efforts across a variety of industries and disciplines like communications, Insurance, Education, Manufacturing, Banking and Retail and more. Therefore, having correct information about it is essential before apply the different techniques.

Bernard Schäfer

About the author

Wenn es um Technologie geht, ist nichts wichtiger als Genauigkeit und Qualität. Wir bei Microsoft sind stolz auf unsere Fähigkeit, unseren Kunden das bestmögliche Erlebnis zu bieten. Unsere Windows- und iOS-Produkte gehören zu den innovativsten der Branche, und wir arbeiten ständig daran, sie zu verbessern. Unsere fehlerfreien PDFs sind ein weiterer Grund, warum unsere Produkte so erfolgreich sind. Wir wissen, dass Qualitätskontrolle bei Arbeitsabläufen und Kommunikation unerlässlich ist, deshalb achten wir sehr darauf, dass alle unsere PDFs fehlerfrei sind. Und schließlich verstehen wir als Gadget-Liebhaber, dass es immer eine Schlüsselpriorität ist, das Leben einfacher zu machen. Wir stellen sicher, dass alle unsere Lumia-Geräte mit Funktionen wie NFC und CarPlay ausgestattet sind, damit Sie Dateien ganz einfach mit Freunden und Familie teilen können. Mit diesen Fähigkeiten

Was ist Data-Mining? Grundlagen und ihre Techniken.

Data Mining-Grundlagen^{(Data Mining Basics)} und ihre Techniken

1] Datenerhebung und -aufbereitung

2] Modellbildung und -evaluierung

Data-Mining-Techniken

What is Data Mining? Basics and its Techniques.

Data Mining Basics and its Techniques

1] Data gathering and Preparation

2] Model Building and Evaluation

Data Mining Techniques

Bernard Schäfer

About the author

Related posts

26 Beste Data-Mining-Software

So verwenden Sie die automatische Datentypfunktion in Excel

Das BitLocker-Setup konnte den BCD-Speicher (Boot Configuration Data) nicht exportieren

So verwalten Sie das Datennutzungslimit unter Windows 11/10

Registrierungsdatei kann nicht importiert werden. Nicht alle Daten wurden in die Registry geschrieben

PCmover Express - Daten von Windows 7 auf Windows 10 kostenlos migrieren

Was ist Big Data – eine einfache Erklärung mit Beispiel

Was ist Data Analytics und wofür wird es verwendet?

Aktivieren, deaktivieren Sie die Datenerfassung für die Zuverlässigkeitsüberwachung in Windows 10

Kostenlose Datenwiederherstellungssoftware: Stellen Sie gelöschte Dateien und Ordner wieder her

Google Chrome löscht den Browserverlauf und die Daten nicht

So verwenden Sie die Funktion „Daten aus Bild einfügen“ in Excel

BurnAware Free Download: Kostenloser CD-, DVD-, Blu-Ray-, HD-Media-Brenner

Wem gehören IoT-Daten? Hersteller, Endbenutzer oder ein Drittanbieter?

Renee Becca Datensicherungssoftware für Windows PC

Big-Data-Konsum. Was sind die Verwendungen von Big Data.

Samsung Data Migration bleibt bei 0 %, 99 % oder 100 % hängen

Löschen oder löschen Sie den Browserverlauf, Cookies, Daten, Cache in Edge

Disk Drill für Windows: Stellen Sie versehentlich gelöschte Dateien wieder her

Mit dem Microsoft Personal Data Dashboard können Sie entscheiden, wie Ihre Daten verwendet werden

Was ist Data-Mining? Grundlagen und ihre Techniken.

Data Mining-Grundlagen(Data Mining Basics) und ihre Techniken

1] Datenerhebung und -aufbereitung

2] Modellbildung und -evaluierung

Data-Mining-Techniken

What is Data Mining? Basics and its Techniques.

Data Mining Basics and its Techniques

1] Data gathering and Preparation

2] Model Building and Evaluation

Data Mining Techniques

Bernard Schäfer

About the author

Related posts

26 Beste Data-Mining-Software

So verwenden Sie die automatische Datentypfunktion in Excel

Das BitLocker-Setup konnte den BCD-Speicher (Boot Configuration Data) nicht exportieren

So verwalten Sie das Datennutzungslimit unter Windows 11/10

Registrierungsdatei kann nicht importiert werden. Nicht alle Daten wurden in die Registry geschrieben

PCmover Express - Daten von Windows 7 auf Windows 10 kostenlos migrieren

Was ist Big Data – eine einfache Erklärung mit Beispiel

Was ist Data Analytics und wofür wird es verwendet?

Aktivieren, deaktivieren Sie die Datenerfassung für die Zuverlässigkeitsüberwachung in Windows 10

Kostenlose Datenwiederherstellungssoftware: Stellen Sie gelöschte Dateien und Ordner wieder her

Google Chrome löscht den Browserverlauf und die Daten nicht

So verwenden Sie die Funktion „Daten aus Bild einfügen“ in Excel

BurnAware Free Download: Kostenloser CD-, DVD-, Blu-Ray-, HD-Media-Brenner

Wem gehören IoT-Daten? Hersteller, Endbenutzer oder ein Drittanbieter?

Renee Becca Datensicherungssoftware für Windows PC

Big-Data-Konsum. Was sind die Verwendungen von Big Data.

Samsung Data Migration bleibt bei 0 %, 99 % oder 100 % hängen

Löschen oder löschen Sie den Browserverlauf, Cookies, Daten, Cache in Edge

Disk Drill für Windows: Stellen Sie versehentlich gelöschte Dateien wieder her

Mit dem Microsoft Personal Data Dashboard können Sie entscheiden, wie Ihre Daten verwendet werden

Data Mining-Grundlagen^{(Data Mining Basics)} und ihre Techniken