leksichka-analiza
Интересно е да се направи и лексичка анализа на програмите на двете најголеми партии во Македонија. При таква анализа, најлесно е да се почне со големината и диверзитетот на вокабуларот (речникот) на зборови во двете програми.
| СДСМ | ВМРО-ДПМНЕ | ||||
|---|---|---|---|---|---|
| Употребени зборови* | 9484 | 14922 | |||
| Вкупно зборови | 59178 | 122276 | |||
| Лексичка густина | 16% | 12.2% |
• Бројот на употребени зборови во еден текст е познат и како лексичка разновидност. Лексичка густина, од друга страна, е колку често во просек зборовите се наоѓаат во текстот. Притоа не се земени во предвид честите зборови во македонскиот јазик (stopwords), а изменетите зборови се нормализирани кон основната форма (луѓе -> човек, мое[. . .]