Theme
지프의 법칙 Zipf's Law
Comments
많이 쓰이는 단어는 정해져 있다는 법칙이다. 통계, 컴퓨터공학에서 많이 쓰인다.
|
어떤 책에서 단어를 추출해서 세어보니
'사랑'이라는 단어가 제일 많이 나오고
'미움'이라는 단어가 두번째로 많이 나오며
'평화'라는 단어가 세번째로 많이 나오면
'사랑'의 등수는 1
'미움'의 등수는 2가 된다.
'평화'의 등수는 3이 된다.
이때 '사랑'의 출현빈도는 1/1에 비례하고
'미움'의 출현빈도는 1/2=0.5에 비례하며
'평화'의 출현빈도는 1/3=0.33에 비례한다.
어떤 요소가 차지하는 비율은 1/K에 비례한다는 어림짐작이 지프의 법칙이다.
제타분포의 특별한 형태이며 여러분야에 적용이 가능하다.
대략 아래의 그림과 같은 법칙이라고 보면 된다.
'사랑'이라는 단어가 제일 많이 나오고
'미움'이라는 단어가 두번째로 많이 나오며
'평화'라는 단어가 세번째로 많이 나오면
'사랑'의 등수는 1
'미움'의 등수는 2가 된다.
'평화'의 등수는 3이 된다.
이때 '사랑'의 출현빈도는 1/1에 비례하고
'미움'의 출현빈도는 1/2=0.5에 비례하며
'평화'의 출현빈도는 1/3=0.33에 비례한다.
어떤 요소가 차지하는 비율은 1/K에 비례한다는 어림짐작이 지프의 법칙이다.
제타분포의 특별한 형태이며 여러분야에 적용이 가능하다.
대략 아래의 그림과 같은 법칙이라고 보면 된다.
'2FeRed`s 공돌이생활 > 기술자료' 카테고리의 다른 글
[공학] 실험계획법 (0) | 2010.07.08 |
---|---|
[리눅스] 우분투에 공학소프트웨어 설치하기 (0) | 2009.07.12 |
[공학] 3차원 스캐너 및 소프트웨어 홈페이지 (0) | 2009.05.15 |
[공학] 3차원 측정 -측정의 역사 (2) | 2009.03.31 |
아름다운 인터넷 문화를 위해 댓글을 남겨주세요. -0-;