Счётная машина Германа Холлерита
Инструменты для обработки big data — больших данных — появились совсем не в XXI, а ещё в XIX веке. Результаты переписи населения в Америке и России в позапрошлом столетии обрабатывались с помощью такой статистической машины.
Машины давно помогают нам с арифметическими расчётами. Прототип арифмометра встречается ещё на эскизах Леонардо да Винчи, а в XVII веке «считающие часы» Вильгельма Шиккарда уже использовались в астрономических исследованиях. К девяностым годам XIX века машинные расчёты окончательно вошли в обиход. Механические арифмометры помогали легко справляться с четырьмя арифметическими действиями. Правда, уже тогда стало понятно, что для обработки больших объёмов данных ручных машин, рассчитанных на выполнение отдельных действий, может быть недостаточно.
В 1897 году в России прошла перепись населения. Данные по каждому из опрошенных группировались по 14 пунктам. Для обработки такого огромного массива информации Центральный статистический комитет приобрёл автоматическую суммирующую машину — табулятор конструкции Германа Холлерита. Семью годами ранее он уже использовался в обработке материалов американской переписи.
В качестве носителя данных в машине Холлерита использовались перфокарты — по одной на каждого из участников переписи. Поскольку всего в переписи участвовало более 125 миллионов человек, сложно представить себе физический объём картона, ушедшего на это мероприятие. Карты пробивали на специальных перфораторах, после чего сортировальные машины упорядочивали их по тому или иному признаку. Далее данные поступали в сумматор, который подсчитывал общий результат.
Разумеется, даже такая продвинутая по тем временам техника не страховала от большого количества ошибок — карты часто заполнялись неправильно, а некоторые вопросы переписи и вовсе не вошли в анализ, так как для них не нашлось свободной ячейки. Тем не менее эта перепись стала важной вехой в развитии статистики в России.
Машина Холлерита уже не была чисто механической — для её работы необходимо было подключение к источнику электропитания.