사용자 행동과 점진적 기계학습을 이용한 쓰레기 편지 여과 시스템의 설계 및 구현
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 김강민 | - |
dc.date.accessioned | 2017-02-22T06:17:06Z | - |
dc.date.available | 2017-02-22T06:17:06Z | - |
dc.date.issued | 2005 | - |
dc.date.submitted | 56822-12-26 | - |
dc.identifier.uri | http://kmou.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002175116 | ko_KR |
dc.identifier.uri | http://repository.kmou.ac.kr/handle/2014.oak/9273 | - |
dc.description.abstract | With rapidly developing Internet applications, an e-mail has been considered as one of the most popular methods for exchanging information because of easy usage and low cost. The e-mail, however, has a serious problem that users can receive a lot of unwanted e-mails, what we called, SPAM mails, and then the user's mailbox can be grown exponentially. The users need for spending time to pick out the SPAM mails and give a great loss economically. To alleviate the problem, many researchers and companies proposed some filtering technologies. On the other hand, in e-mail client systems, users do different actions according to usefulness of information on mails, and some classification and recommendation systems like GroupLens use the actions to improve the performance. This paper presents a mail filtering system using user actions and incremental machine learning. E-mail data and user actions are collected through some user interface implemented in CGI/Perl. Our proposed system makes use of two models: One is anaction inference model to draw a user action from an e-mail and the other is a mail classification model to decide if an e-mail is SPAM or not. All the two models are derived using incremental learning, of which an algorithm is IB2 of TiMBL. To evaluate our proposed system, we collect 10,000 mails of 12 persons from Hanmail (www.hanmail.net), which is one of the most popular e-mail service providers in Korea. The accuracy is 81 ~ 93% according to each person. Our proposed system outperforms a system that does not use any information about user actions. Consequently, we have shown that information about user actions is useful for e-mail filtering | - |
dc.description.tableofcontents | Abstract = ⅴ 제 1 장 서론 = 1 제 2 장 관련 연구 = 3 2.1 쓰레기 편지 차단을 위한 기술적 대응 방법 = 3 2.1.1 편지 주소 수집 차단 기술 = 3 2.1.2 대량 쓰레기 편지 발송 대응 기술 = 4 2.1.3 쓰레기 편지 발송자 신원 확인 기술 = 5 2.1.4 쓰레기 편지 여과 기술 = 6 2.2 기계학습을 이용한 쓰레기 편지 여과 = 7 2.2.1 베이지안 분류를 이용한 쓰레기 편지 여과 = 8 2.2.2 지지벡터를 이용한 쓰레기 편지 여과 = 9 2.2.3 사례기반 학습을 이용한 쓰레기 편지 여과 = 10 2.3 묵시적 피드백 = 12 2.4 편지 학습 말뭉치 = 14 제 3 장 사용자 행동과 점진적 기계학습을 이용한 쓰레기 편지 여과 시스템의 설계 및 구현 = 16 3.1 학습 말뭉치 구축 과정 = 17 3.1.1 전처리 과정 = 17 3.1.2 사전 생성 = 19 3.1.3 사용자 인터페이스를 통한 행동 정보 수집 = 20 3.2 학습 과정 = 22 3.2.1 모델 구축을 위한 자질 추출 = 22 3.2.2 학습을 이용한 모델 생성 = 23 3.3 분류 과정 = 26 제 4 장 실험 및 평가 = 27 4.1 실험 말뭉치 = 27 4.2 성능 평가 방법 = 28 4.3 분류 정확도 평가와 분석 = 29 4.3.1 학습 데이터 양에 따른 분류 정확도 = 29 4.3.2 사용자별 분류 결과 차이 분석 = 30 4.3.3 최적의 분류 결과를 나타내는 학습 데이터 양 = 31 4.4 분류의 증거로 사용되는 행동 패턴 분석 = 32 4.5 쓰레기 편지 여과작업에서 행동 정보의 유용성 여부 평가 = 33 4.6 기존 쓰레기 편지 여과 시스템과의 비교 = 34 제 5 장 결론 및 향후 연구과제 = 36 참고문헌 = 38 | - |
dc.language | kor | - |
dc.publisher | 한국해양대학교 대학원 | - |
dc.title | 사용자 행동과 점진적 기계학습을 이용한 쓰레기 편지 여과 시스템의 설계 및 구현 | - |
dc.title.alternative | Design and Implementation of SPAM Filtering System Using User Action and Incremental Machine Learning | - |
dc.type | Thesis | - |
dc.date.awarded | 2006-02 | - |
dc.contributor.alternativeName | Kim | - |
dc.contributor.alternativeName | Kang-Min | - |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.