Name: АВК - ДЗ до 18 марта 2015 г.
Item: АВК - ДЗ до 18 марта 2015 г.
Author: Idilliya

1 Idilliya (09.03.2015 00:12)

Алгоритм создания ЧС с помощью MS Word и MS Wxcel (для тех, кто не был на занятии или ничего не записал):

Обработка текста в MS Word
0) Избавиться от лишних слов (название, автор и т.п.), оставив только текст произведения.
1) Все буквы сделать прописными (не заглавными): Shft+F3
2) Заменить все знаки препинания кроме дефисов на знаки абзаца, чтобы каждое слово было в отдельной строке. Для этого должна быть включена опция ПОДСТАНОВОЧНЫЕ ЗНАКИ, в поле Найти указан диапазон с пробелом внутри [ \!\?\.\,\:\;\…\–\"\)\(\«\»\*], а в поле заменить - специальный знак абзаца (^p), он самый верхний в Специальных знаках.
3) Убрать пустые строки заменив каждые два знака абзаца (^p^p) на один знак абзаца (^p). При необходимости повторить процедуру несколько раз, пока не останется пустых строк. Опция ПОДСТАНОВОЧНЫЕ ЗНАКИ должна быть отключена.

Обработка текста в MS Excel
0) Полученный список слов в MS Word вырезать и вставить на лист MS Excel, стоя на ячейке A2, чтобы в ячейке A1 можно было указать название столбца "СЛОВОФОРМЫ".
1) Украсив ячейку A1, чтобы она отличалась от нижеследующих, закрепить первую строку на вкладке ВИД - "Закрепить области".
2) Назвав ячейку B1 "ЛЕКСЕМЫ", приведите в столбце "B" слова из столбца "A" к словарной форме, опираясь на аналитическую грамматику русского языка, разработанную создателями частотного словаря Л.Н. Засориной.
3) Назвав ячейку C1 "Грам.кат.", заполните столбец "C", определив для каждой лексемы ее грамматическую категорию.

Создание сводной таблицы в MS Excel
Если бы нам нужен был только частотный словарь словоформ, сводную таблицу можно было создавать уже сразу после этапа 0) при обработке текста в MS Excel. Но нам нужны именно столбцы "В" и "С".
1) Выделите столбцы "В" и "С", просто проведя левой кнопкой мыши по их буквам в нулевой строке.
2) На вкладке "Вставка" слева нажмите на кнопку "Сводная таблица" и нажмите Ок, не меняя опций.
3) На новом листе открылась заготовка под сводную таблицу.
4) Справа в окне "Выберите поля..." сначала включите опцию "Лексемы", затем из этого же окна перетащите опцию "Лексемы" в окно "Сумма Значения". Возле каждой лексемы появится количество ее употреблений в тексте. Сейчас лексемы отсортированы по алфавиту - это алфавитно-частотный словник.
5) Если отсортировать их по столбцу с числами (сортировка по убыванию от Я до А), мы получим частотный словник, где сверху будут самые частые слова.
6) Если отключить опцию "Лексемы" и шаги 4-5 проделать с опцией "Грам.кат", мы получим информацию о частоте употребляемых в тексте грамматических категориях, что дает нам широкое поле для проведения исследований в лексикостатистике.