2011년 5월 23일 월요일

친숙한 웹 페이지 정보 항목명 선택을 위한 지표 비교

인터넷 웹페이지나 XML 등을 통해 정보를 공유할 때, 친숙한 정보항목 명칭은 사용자 간에 혼동을 최소화한다. 친숙한 단어를 선택하기 위해 언어 전문가의 의견을 구하는 경우 비용과 시간이 소모되지만, 자동화된 지표는 별도의 비용 없이 참고정보를 제공하여 사용자가 친숙한 단어를 선택하도록 돕는다. 본 논문은 사용자가 인터넷에서 쉽게 접할 수 있는 지표를 수집하여, 친숙한 단어를 선택하는데 사용 효과를 비교 조사하였다. 수집된 지표는 단어 길이, 관련 사이트에 사용되는 빈도, 검색 사이트에서 결과 건수이다. 관련 사이트에 사용되는 빈도에 의해 선택된 단어가 여성의 것과 최고 76%, 남성의 것과 최고 71% 매칭 되는 것으로 나타나, 참고 지표로 사용 가능한 것으로 결과가 나타났다.

논문받기

댓글 없음:

댓글 쓰기

ETL 솔루션 환경

ETL 솔루션 환경 하둡은 대용량 데이터를 값싸고 빠르게 분석할 수 있는 길을 만들어줬다. 통계분석 엔진인 “R”역시 하둡 못지 않게 관심을 받고 있다. 빅데이터 역시 데이터라는 점을 볼때 분산처리와 분석 그 이전에 데이터 품질 등 데이...