한국해양대학교

Detailed Information

Metadata Downloads

사용자 행동과 점진적 기계학습을 이용한 쓰레기 편지 여과 시스템의 설계 및 구현

DC Field Value Language
dc.contributor.author 김강민 -
dc.date.accessioned 2017-02-22T06:17:06Z -
dc.date.available 2017-02-22T06:17:06Z -
dc.date.issued 2005 -
dc.date.submitted 56822-12-26 -
dc.identifier.uri http://kmou.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002175116 ko_KR
dc.identifier.uri http://repository.kmou.ac.kr/handle/2014.oak/9273 -
dc.description.abstract With rapidly developing Internet applications, an e-mail has been considered as one of the most popular methods for exchanging information because of easy usage and low cost. The e-mail, however, has a serious problem that users can receive a lot of unwanted e-mails, what we called, SPAM mails, and then the user's mailbox can be grown exponentially. The users need for spending time to pick out the SPAM mails and give a great loss economically. To alleviate the problem, many researchers and companies proposed some filtering technologies. On the other hand, in e-mail client systems, users do different actions according to usefulness of information on mails, and some classification and recommendation systems like GroupLens use the actions to improve the performance. This paper presents a mail filtering system using user actions and incremental machine learning. E-mail data and user actions are collected through some user interface implemented in CGI/Perl. Our proposed system makes use of two models: One is anaction inference model to draw a user action from an e-mail and the other is a mail classification model to decide if an e-mail is SPAM or not. All the two models are derived using incremental learning, of which an algorithm is IB2 of TiMBL. To evaluate our proposed system, we collect 10,000 mails of 12 persons from Hanmail (www.hanmail.net), which is one of the most popular e-mail service providers in Korea. The accuracy is 81 ~ 93% according to each person. Our proposed system outperforms a system that does not use any information about user actions. Consequently, we have shown that information about user actions is useful for e-mail filtering -
dc.description.tableofcontents Abstract = ⅴ 제 1 장 서론 = 1 제 2 장 관련 연구 = 3 2.1 쓰레기 편지 차단을 위한 기술적 대응 방법 = 3 2.1.1 편지 주소 수집 차단 기술 = 3 2.1.2 대량 쓰레기 편지 발송 대응 기술 = 4 2.1.3 쓰레기 편지 발송자 신원 확인 기술 = 5 2.1.4 쓰레기 편지 여과 기술 = 6 2.2 기계학습을 이용한 쓰레기 편지 여과 = 7 2.2.1 베이지안 분류를 이용한 쓰레기 편지 여과 = 8 2.2.2 지지벡터를 이용한 쓰레기 편지 여과 = 9 2.2.3 사례기반 학습을 이용한 쓰레기 편지 여과 = 10 2.3 묵시적 피드백 = 12 2.4 편지 학습 말뭉치 = 14 제 3 장 사용자 행동과 점진적 기계학습을 이용한 쓰레기 편지 여과 시스템의 설계 및 구현 = 16 3.1 학습 말뭉치 구축 과정 = 17 3.1.1 전처리 과정 = 17 3.1.2 사전 생성 = 19 3.1.3 사용자 인터페이스를 통한 행동 정보 수집 = 20 3.2 학습 과정 = 22 3.2.1 모델 구축을 위한 자질 추출 = 22 3.2.2 학습을 이용한 모델 생성 = 23 3.3 분류 과정 = 26 제 4 장 실험 및 평가 = 27 4.1 실험 말뭉치 = 27 4.2 성능 평가 방법 = 28 4.3 분류 정확도 평가와 분석 = 29 4.3.1 학습 데이터 양에 따른 분류 정확도 = 29 4.3.2 사용자별 분류 결과 차이 분석 = 30 4.3.3 최적의 분류 결과를 나타내는 학습 데이터 양 = 31 4.4 분류의 증거로 사용되는 행동 패턴 분석 = 32 4.5 쓰레기 편지 여과작업에서 행동 정보의 유용성 여부 평가 = 33 4.6 기존 쓰레기 편지 여과 시스템과의 비교 = 34 제 5 장 결론 및 향후 연구과제 = 36 참고문헌 = 38 -
dc.language kor -
dc.publisher 한국해양대학교 대학원 -
dc.title 사용자 행동과 점진적 기계학습을 이용한 쓰레기 편지 여과 시스템의 설계 및 구현 -
dc.title.alternative Design and Implementation of SPAM Filtering System Using User Action and Incremental Machine Learning -
dc.type Thesis -
dc.date.awarded 2006-02 -
dc.contributor.alternativeName Kim -
dc.contributor.alternativeName Kang-Min -
Appears in Collections:
컴퓨터공학과 > Thesis
Files in This Item:
000002175116.pdf Download

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse