Sie sind hier: Grundsätze | Konzept | Methoden | Auswertung | Data-Mining

Das "Schürfen" nach den Zusammenhängen innerhalb von riesigen Datenmengen wird "Data-Mining" genannt. Dies lernen Menschen im Laufe ihrer biographischen Entwicklung (selektives Wahrnehmen; Strukturenerkennung usw) (Tembrock - Informationswechsel-Schema).

Dieses kann zu den multivariaten statistischen Methoden gezählt werden. Dabei sucht der "Computer" nach den in den Datenmengen (Rohdaten) innewohnenden Gesetzmäßigkeiten und Mustern (Typen, Cluster). Es sind explorative Daten-Analysen, man kennt die Zusammenhänge vorher nicht, man vermutet aber welche, und die gilt es heraus zu finden ("entdecken") (Gegensatz dazu - Theorie-geleitete Datenanalyse - wie z.B. Regressions- und Korrelationsanalysen)

(Übersicht 76 - Umgang mit der Informationsfülle, Lösen von Problemen in komplexen Systemen)

Übersicht 80 - Multivariater Auswertungen - Literaturliste

Data-Mining wird in vielen Bereichen angewendet. Aus relativ einfachen multivariaten Analysen wurden, ermöglicht durch die rasche IT-Entwicklung und durch das gesellschaftliche Interesse, d.h. entsprechende Forschungsförderung ist schnell ein sehr umfangreiches und dynamisches Wissenschaftsgebiet geworden. (Anmerkungen zur gesellschaftlichen FReleanz: Bilderkennung - Terrorismusfahndung; Marktforschung - efficient consumer response; Zielgruppen angepasstes Marketing; z.B. Kooperation - DM-Drogerie-Markt+Metro-Gruppe - Aufträge an Universität des Saarlandes).

In der Marktforschung (und das könnte genauso in der Ernährungsverhaltensforschung sein) wird nach den Zielgruppen, deren Interessen und Gewohnheiten, gesucht. Datengrundlagen sind z.B. die Informationen, die man dadurch erhält, dass die Käufer sich identifizieren in dem sie Kundenbindungskarten (Payback-Karten u.a.) beim Einkauf nutzen. Alle elektronischen Informationen (verbunden mit persönlichen Karten - EC-Karte; Gesundheitskarten, usw.; der Nutzung des eCommerce, ua,) können heute gebündelt werden und zur Suche nach bzw. Ermittlung von charakteristischen Muster (Raster, Cluster, usw) genutzt werden. Die Einführung von RFID erhöht die Informationsmenge, und damit die Notwendigkeit noch effizientere Datamining zubereiten, bzw. "Knowledge Discovery in Databases".

Im naturwissenschafltichen Bereich werden entsprechende Data-Mining-Programme unter den Stichworten - Foodinformatics und Bioinformatics - benutzt.

Es gibt viele Informationen im Internet dazu - z.B. auch Vorlesungen, hier eine Auswahl

http://www2.informatik.hu-berlin.de/Forschung_Lehre/wm/mldm2006w.html

http://www.cs.uni-potsdam.de/~scheffer/

http://de.wikipedia.org/wiki/Data_mining

Agenten-Technologie reizt dm „Real Simulation Engine“ / LZ 08.07.2005, S.24

Prof. Dr Joachim Hertel / künstliche Intelligenz – Informationstechnologie im Einzelhandel -  „Multi-Agenten-Technologie“

http://frweb.cs.uni-sb.de/05.Wir/02.Dozenten/index.php

www.old.netobjectdays.org/ pdf/03/papers/mates/28310074.pdf  

http://www.dfki.de/web/forschung/km/index_html

http://dbis.ipd.uni-karlsruhe.de/384.php

http://www.is.informatik.uni-duisburg.de/courses/dm_ws05/index.html

http://www.andreas-abecker.de/Teaching/DM-Survey-Knut.pdf

http://www.iais.fraunhofer.de/1463.html?&L=0

 

Bioinformatics- http://de.wikipedia.org/wiki/Bioinformatik

Food-Informatics -http://www.afsg.nl/InformationManagement/index.php?Itemid=0&id=21&option=com_content&task=view

Information and Knowledge Managers from Agricultural Institutions,

http://www.fao.org/aims/pub_aos8.jsp

 

Max-Planck-Institut für Dynamik und Selbstorganisation (Göttingen) - www.ds.mpg.de -

Aktuell - Nachrichtendienstaffäre
NSA (Geheimdienst USA) Enthüllungen durch E.Snowden - PRISM-Program
Zeit Nr.30 - 18.7.13 – S.31 Data-Mining Die Suche nach Mustern in Datenbergen von Gero von Randow
Greenwald;G. 27.6.13 - Guardian -

Es wird auch von "Big data" gesprochen
Themenschwerpunkt in der Zeitschrift "Aus Politik und Zeitgeschichte" Nr.11-12/09.03.2015 (download)- vom www.bpb.de

Leimbach, T., Bachlechner, D.: TA-Vorstudie »Big Data in der Cloud« TAB-Hintergrundpapier Nr. 19 Es wird erwartet, dass die automatisierte Auswertung der kontinuierlich wachsenden öffentlichen und privaten Datenbestände nicht nur den Markt für Informationstechnologie (IT), sondern die Gesellschaft insgesamt hin zu einer digitalen Ökonomie nachhaltig verändert. Big Data steht dabei für Ansätze zur Analyse besonders großer, heterogener Datenmengen, während Cloud Computing die bedarfsgerechte Bereitstellung von IT-Ressourcen über ein Netzwerk beschreibt. (link bei www.tab-beim-bundestag.de ) (Download)
http://www.tab-beim-bundestag.de/de/aktuelles/20150421.html