데이터 마이닝
페이지 정보
작성일 23-02-07 10:16
본문
Download : 데이터.hwp
- 인터넷(Internet) 등 네트워크 발전
- Wal mart : 20 million transactions a day





- 장남식 외, “데이터마이닝” 1장
□ Data + Mining : 정보를 채굴하다. 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 과정. 금이나 다이아몬드를 발견하기 위해 수많은 흙과 잡석들을 파헤치고 제거하는 것과 유사하다는 데에 기인.
- 정보기술의 빠른 발전은 업무의 자동화를 촉진시켜 엄청난 양의 데이터를 전자적으로 수집하고 보관하는 것을 가능하게 하였음 (Flood of data)
□ 정보화 시대의 도래
□ 대용량의 데이터베이스로부터 이전에 알지 못한, 행동 가능한 정보를 추출하는 지식발견 프로세스 (knowledge discovery process) (Meta Group)
5.1 분류 分析(분석) (Classification analysis)
- 정보 저장 기술의 발전
5.5 연속패턴分析(분석) (Sequential pattern analysis)
2. 데이터마이닝 필요 배경 (Fayyad et al. 1996, 장남식외 1장)
☞ Reading Material
데이터마이닝 / (데이터마이닝)
- 정보 처리 속도의 향상
◇ CPU 성능 향상 및 메모리 용량 증대
3. 데이터마이닝 관련 분야 및 유사용어
7. 기타 고려사항
◇ 학습능력을 갖춘 알고리듬이나 program 개발
- 데이터 分析(분석)기법의 발전
e.g)
- Genome project : gigabytes of data on the human genetic codes
- 이러한 환경에서 기업이 생존하고 발전하기 위해서는 지속적으로 소비자의 동향과 경쟁사의 경영전술 등을 신속하게 分析(분석)할 수 있는 능력이 중요
- 방대한 양의 데이터로부터 유용한 지식을 얻도록 사람을 지능적이고 자동적으로 지원하는 새로운 기법과 도구가 필요
◇ faster, higher capacity
4. 데이터마이닝 활용분야
- Mobil oil corporation : over 100 terabytes of data related to oil exploration
◇ Scientific data collection (from remote sensors or from space satellites)
2. 데이터마이닝 필요 배경
(예, 판매시점관리(POS) 데이터, 주식거래 데이터, 병원의 환자 데이터, 전화통화기록 데이터, 카탈로그 주문 데이터, 은행 거래 데이터, flight(항공)예약 데이터, 신용카드 결제 데이터, 제조업체의 품질관리 데이터, 세금 환급 데이터 등)
◇ Bar code system
Download : 데이터.hwp( 84 )
- 정보가 기업경영의 경쟁력을 결정하는 가장 중요한 요소
◇ Data warehouse technology
- 그러나, 데이터 양이 기하급수적으로 증대함에 따라 스프레드시트나 ad-hoc 쿼리와 같은 수작업에 의한 데이터 分析(분석)방법으로는 어려움 발생
6. 기존 접근방법과 데이터마이닝
5.7 Data mining methods
◇ Cheaper storage devices
- 데이터의 양이 오늘날과 같이 방대하지 않았던 과거에는 소수의 전문가들이 통계기법이나 질의(query) 등을 통해 데이터를 分析(분석)하고 요약된 결과를 보고서 형식으로 제공하였음
□ 정보기술의 가속적 발전
□ 대용량의 데이터로부터 이들 데이터 내에 존재하는 관계, 패턴, 규칙 등을 탐색하고 찾아내어 모형화함으로써 유용한 지식을 추출하는 일련의 과정들
◇ 데이터마이닝 등 分析(분석) 기법 발달
□ 저장된 대용량의 데이터를 패턴인식, 통계학, 수학 등의 기법을 이용해 分析(분석)함으로써, 의미 있는 새로운 상관관계, 패턴, 그리고 경향 등을 발견하는 프로세스 (Gartner Group)
5. 데이터마이닝 기법
데이터마이닝 / (데이터마이닝)
- NASA EOS (Earth Observing System) : 50 gigabytes of remotely sensored image data per hour
□ 데이터의 홍수, 정보의 빈곤 (Data is rich, but information is poor)
5.2 군집 分析(분석) (Clustering analysis)
설명
1. 데이터마이닝의 定義(정이)
레포트 > 기타
◇ Computerization of many business and government transactions
◇ 데이터 획득 및 공유 용이
5.3 예측 (Prediction)
[참고 문헌]
- 생산자 위주 시장 환경 → 소비자 주도 시장환경으로 變化
데이터마이닝
데이터 마이닝
5.6 기타 데이터마이닝 작업
◇ Better DBMS
순서
다.