Datamining Project


이번 학기 수강했던 데이터마이닝의 프로젝트 내역입니다. 컴퓨터 판매에 대한 1달간의 판매내역을 중심으로,
이를 요구사항을 정해 분석하여 전략을 제시하는 것이 주요 내역이었습니다. 즉, 과목에서 배웠던 모든 내용들을
총동원하여 엮어나가는 점이 관건입니다.

과목 자체가 무척 흥미롭습니다. 일군의 데이터 묶음으로부터 숨은 관계, 의미를 추출해내는 작업입니다.
마치 규칙없이 사방으로 흩어진 퍼즐 조각을 이리저리 맞추다보니 안에 어떤 숨은 글자가 있는 것과 같은 느낌이랄까요,
그런 점이 이 데이터마이닝의 매력인 것 같습니다. 하지만 실제 적용되기 어려운 점은,

해당하는 변수들에 대해서는 하나의 기준으로 단일화되기 어렵다는 것입니다. 이들은 복합적이기 때문에,
충분히 이들을 정의했으니 이 내부에서 단서들을 찾아내겠지- 하고 단정짓기 어렵다는 것입니다.
두 번째로는 해당 데이터 셋의 수집이 어렵다는 점입니다. 비지니스에 이를 접목하려면 목적하는 데이터 그룹이
확보되어야 하는데 가볍게 통계 정보들로만 보기에는 가치가 높은 정보들이 주류라 공개되어 있는 것이 거의 없고,
수집에 시간도, 노력도, 실질적인 경제적 비용까지도 많이 들여야 할 것입니다.

어쨌건, 그런 제약사항이 있지만 이 조건만 해결된다면 내부에서 생각지 못한 관계, 추측이 가능해집니다.
분류 나무는 직관적으로 나타나는 예시여서 그렇지만 회귀분석이나, 군집 분석 등은 이 데이터마이닝 작업에 있어서
꽃과 같은 내용입니다. 덤으로 붙여보자면 분류 모형, 연관성 분석 등을 꼽아볼 수 있겠습니다.

작업 내용도 재밌었습니다.  한 팀원분과는 잊지 못할 에피소드가 생기긴 했습니다만(-_-;) 잘 해결되어 다행입니다.
고마워요, 발표자분. ^^

'Track 1 (Senior) > Major : CE (Project)' 카테고리의 다른 글

종합설계 진척 상황  (0) 2011.06.20
Database 실습 프로젝트  (0) 2011.06.20
Software Engineering Project  (0) 2011.06.19
마이크로프로세서 텀프로젝트  (0) 2011.06.19
Computer Graphics Term Project  (0) 2011.06.19