MS Excel. Приемы работы с данными. Юрий Николаевич Лубягин
Чтение книги онлайн.
Читать онлайн книгу MS Excel. Приемы работы с данными - Юрий Николаевич Лубягин страница 4
В Excel массив данных представлен в виде диапазона или нескольких диапазонов. Диапазон в Excel состоит из одной и более ячеек. В Excel ограничения на количество столбцов и строк на листе определены версией приложения. Версия 2010, на которой рассматриваются примеры, позволяет создать на одном листе диапазон из 16384 столбца и 1048576 строк.
Работа с одномерными массивами данных
Одномерный массив данных, например, перечисление ИНН физических лиц или ФИО состоящий из одного столбца.
Операции с одномерным массивом
1. Проверка на наличие дублей записей и их удаление;
2. Поиск дублирующих записей;
3. Сравнение (поиск разности и пересечения).
Проверка наличия и удаление дублей данных в одномерном массиве
У нас есть массив данных, состоящий из 10000 записей и не известно, есть ли в нем повторяющие записи, а просматривать визуально потребует большие временные затраты. Для удаления дубликатов в Excel на вкладке «Данные» есть кнопка «Удалить дубликаты».
Выделяем весь диапазон данных. Для быстрого выделения необходимо выделить первую запись в списке (заголовок можно не выделять) и одновременно нажать на клавиатуре кнопки Ctrl+Shift+↓(стрелочка вниз). Это прием работает и с конца списка, достаточно выделить последнюю ячейку и одновременно нажать клавиши Ctrl+Shift+↑(стрелочка вверх). И так же и вправо и влево.
Выделив диапазон, на вкладке «Данные» нажимаем кнопку «Удалить дубликаты»
Выходит диалоговое окно.
Нажимаем «ОК»
Получаем информационное сообщение о количестве удаленных повторяющих значений и количестве оставшихся уникальных значений.
Дубли из массива удалены, все записи в нем уникальны.
Поиск повторяющих данных в массиве
Теперь необходимо узнать, какие записи и сколько раз повторяются . Вернем массив, в исходное состояние, через кнопку отмена, или используя сочетание клавиш Ctrl+Z.
Выделяем массив, копируем и вставляем рядом или на другой лист (в описываемом примере мы вставили список на этот же лист, в столбец D). И проводим над скопированным массивом операции по удалению повторяющих значений. Теперь у нас два массива, исходный и содержащий уникальные записи.
Исходному массиву присваиваем имя. Для этого выделяем его Ctrl+Shift+↓(стрелочка вниз) и не снимая выделения, нажатием