1. 2008.11 문서기반 기사 자동분류 시스템 #
[PNG image (152.62 KB)]
개발기간 24일 (2008년 11월 15일 ~ 2008년 12월 09일) ● 프로그램 요약 I.기사 자동분류 시스템(ACS) 란? ▶ 대량의 웹문서를 이용해 주제 연관 데이터베이스를 생성하고, 생성한 데이터베이스를 kNN 모델을 이용해 문서 주제를 자동으로 분류하는 프로그램. II. 프로그램 개발 언어(SDK) 및 환경 ▶ 개발 언어(SDK) : C++, Boost(Regex) ▶ 개발 환경 : Visual Studio 2008, Windows Vista III. 사용 환경 ▶ Windows XP, Windows Vista (32bit) IV. 주요 기능 ① 분류 DB 생성 ▶ 주제 분류를 위한 DB를 생성하는 기능. ② 분류 DB 불러오기 ▶ 준비된 DB를 메모리에 등록한다. ③ 분류 실행 ▶ kNN 알고리즘을 거쳐 최적의 적합도를 가지는 주제 결과를 나열한다.
binary.zip (2.67 MB)
- 발표자료