leksichka-analiza
Интересно е да се направи и лексичка анализа на програмите на двете најголеми партии во Македонија. При таква анализа, најлесно е да се почне со големината и диверзитетот на вокабуларот (речникот) на зборови во двете програми.
СДСМ | ВМРО-ДПМНЕ | ||||
---|---|---|---|---|---|
Употребени зборови* | 9484 | 14922 | |||
Вкупно зборови | 59178 | 122276 | |||
Лексичка густина | 16% | 12.2% |
• Бројот на употребени зборови во еден текст е познат и како лексичка разновидност. Лексичка густина, од друга страна, е колку често во просек зборовите се наоѓаат во текстот. Притоа не се земени во предвид честите зборови во македонскиот јазик (stopwords), а изменетите зборови се нормализирани кон основната форма (луѓе -> човек, мое[. . .]