Шкалы измерений
До сих пор мы рассматривали лишь геометрические объекты, с которыми, как мы видели, ассоциированы наборы координат, позволяющие указать их расположение в пространстве. Картографические объекты содержат информацию не только о том, как они занимают пространство, но о том, чем эти объекты являются и насколько они важны для нашего рассмотрения.
Например, дерево, обозначенное как точечный объект, может быть отнесено к определенному классу на основе таксономической терминологии, то есть дуб, сосна и т.п. Мы можем узнать также возраст дерева, пробурив его и подсчитав годовые кольца. С этой дополнительной информацией мы теперь знаем, что есть не просто некоторое дерево, расположенное в некоторой точке пространства, но что это, скажем, дуб тридцати пяти лет. Дополнительная не пространственная информация, которая помогает нам описывать объекты, наблюдаемые в пространстве, образует набор атрибутов объектов. Когда мы наблюдаем наше пространственное окружение, мы начинаем распределять его атрибуты по категориям и отмечать где они находятся. В нашей природе, природе существ любознательных, заложено желание классифицировать, давать ярлыки вещам, которые нам попадаются, для того, чтобы мы могли привнести дополнительный уровень организации в наше пространство. И теперь мы можем указать, что определенный объект с определенным названием, с разными измеримыми атрибутами наличествует в определенном месте.
Но перед тем как присвоить эти атрибуты объектам, мы должны знать, как их измерять. Иначе мы не сможем сравнивать объекты в одном месте с объектами в другом месте. Каким эталоном нам пользоваться? Насколько точно мы можем описывать объекты, с которыми имеем дело? Какой эффект будут иметь различные уровни точности измерений на нашу способность сравнивать объекты?
К счастью, уже существует устоявшаяся основа для измерения почти всех данных, в том числе и географических. Эти так называемые шкалы измерения данных (levels of data measurement) простираются от простого именования объектов, для того, чтобы мы могли называть их, до высокоточных измерений, позволяющих нам непосредственно сравнивать качества различных объектов. Используемая шкала измерений будет определяться отчасти тем, что мы классифицируем, отчасти тем, что мы хотим знать, и отчасти нашими возможностями производить измерения при заданном масштабе наблюдения. Рисунок 2.4 иллюстрирует шкалы измерений в связи с 3-мя часто используемыми типами географических объектов.
На первом уровне находится номинальная шкала (nominal scale), из названия которой следует, что объекты различаются по именам. Эта система позволяет нам делать высказывания о том, как называется объект, но не позволяет делать прямого сравнения одного объекта и другого, за исключением определения тождества. Например, мы можем сказать, что в одном месте находится клён, а в другом - дуб. Хотя такое утверждение, несомненно, различает эти объекты, мы не сможем сравнивать их, т.к. они разные по природе. То есть, мы не можем утверждать, что церковь лучше или хуже, чем пожарная станция, так же как мы не можем делать подобных утверждений относительно яблок и апельсинов.
Если мы хотим провести более тонкое сравнение объектов, нам следует выбрать более высокую шкалу измерений. В нашем примере с деревьями, если бы мы захотели выяснить, насколько хороши клён, ясень или сосна в качестве декорации к пикнику, мы можем поместить их на шкалу порядков, от лучшего к худшему для данного конкретного вопроса.
Поскольку сосны часто имеют низкие ветви и сбрасывают кусочки коры и смолы на землю, мы, вероятно, отнесли бы их к наихудшему случаю среди этих трех. Хотя ясени производят меньше мусора и не имеют низких ветвей, их листья малы, и некоторое количество солнечных лучей проникнет через крону. Мы можем отнести ясень к среднему варианту для пикника. В противоположность ясеню, клёны создают густую тень, к тому же он не производит много мусора и не имеет низких ветвей. Следовательно, мы можем отнести его к наилучшему классу на нашей порядковой шкале.
В нашем примере с пикником мы создали спектр значений от лучшего к худшему. Очевидно, однако, что этот спектр основан исключительно на цели использования данной информации и не может относиться к другим применениям деревьев. К примеру, ни клён, ни ясень не интересны для Рождества. Таким образом, наша классификация основана на одном аспекте, отражающем один набор условий. Далее: очевидно, что порядковые данные могут дать нам некоторое представление о последовательном сравнении пространственных объектов, но эти сравнения ограничены данным частным применением. Возьмем другой пример: отметку, которую вы получите за курс геоинформатики, нельзя сравнить с отметкой, полученной за дифференциальное исчисление. Здесь действуют два принципиально различных набора критериев. Если мы хотим быть более точными в наших измерениях, нам следует использовать интервальную шкалу.
Измерения, в которой измеряемым величинам приписываются численные значения. Как и в случае порядковой шкалы, здесь мы тоже можем сравнивать объекты, но здесь эти сравнения могут делаться с более точной оценкой различий. Хорошим примером пространственных данных, измеряемых в интервальной шкале, является температура почвы на некоторой исследуемой площади с существенно различными типами почв. Мы можем обнаружить, что температура очень темной, богатой перегноем почвы значительно выше температуры более светлой почвы с малым содержанием органического вещества. В частности, мы можем сказать, что в одно время температурная разница между разными видами почв составляет 4°С, более темная почва имеет температуру 29°С, в то время как более светлая - только 25°С. Теперь мы имеем легко измеримую, точно градуированную разницу между почвами в двух выбранных местах.
Но остается одно ограничение при выполнении сравнений в интервальной шкале. Возьмем еще два, предельно различных вида почв, один - практически белый, а другой - почти черный. При термометрировании их в одно время мы можем получить числа 10"C и 20°С. Как и раньше, мы можем получить численную разность между этими величинами 10°С. Но можем ли мы при этом сказать, что темная почва вдвое теплее светлой? На первый взгляд так и есть. Но нам следует вспомнить, что начало шкалы Цельсия выбрано произвольно. А для того, чтобы вычислить отношение двух величин, нужно иметь шкалу, на которой 0 представляет действительное начало температур. В данном примере нам следует перевести все величины в шкалу Кельвина, в которой начальная точка соответствует полному отсутствию движения молекул, с которым связано тепло. И когда мы преобразуем наши величины в соответственно 283 К и 293 К, мы увидим, что темная почва вовсе не вдвое теплее светлой.
В результате перехода от шкалы Цельсия к шкале Кельвина мы оказались на последней и наиболее "количественной" шкале измерений - шкале отношений (ratio scale). Приведя температуру к абсолютной шкале, мы получили осмысленное отношение величин, поскольку мы действовали теперь на шкале отношений*.
Может быть полезен и другой пример, поскольку он использует параметры, которые нам часто интересны. Допустим, мы исследуем две группы домов, расположенных в разных частях города: одна - в богатом районе пригорода, другая - в районе жителей с невысоким доходом, внутри города. Обследовав жителей, мы получили среднегодовой доход в первом районе 50000долларов, во втором - 25000. Поскольку 0 долларов означает отсутствие дохода, мы спокойно утверждаем, что имеем дело со шкалой отношений и, следовательно, можем вычислять относительное различие. Разделив одну величину на другую, мы можем корректно утверждать, что среднегодовой доход семьи в первом районе вдвое больше, чем во втором. Однако, как и в случае негеографических данных, они корректны только с данными шкалы отношений.
