Tag: leksichka-analiza

Лексичка анализа на програмите на двете најголеми политички партии во Македонија

Интересно е да се направи и лексичка анализа на програмите на двете најголеми партии во Македонија. При таква анализа, најлесно е да се почне со големината и диверзитетот на вокабуларот (речникот) на зборови во двете програми.

СДСМ ВМРО-ДПМНЕ
Употребени зборови* 9484 14922
Вкупно зборови 59178 122276
Лексичка густина 16% 12.2%

• Бројот на употребени зборови во еден текст е познат и како лексичка разновидност. Лексичка густина, од друга страна, е колку често во просек зборовите се наоѓаат во текстот. Притоа не се земени во предвид честите зборови во македонскиот јазик (stopwords), а изменетите зборови се нормализирани кон основната форма (луѓе -> човек, мое[. . .]