Обобщение результатов выборок
Пространственные данные, полученные в результате пространственного отбора, подвергаются манипуляциям трех видов: характеристики не отборных местоположений могут быть предсказаны из характеристик отобранных; данные внутри границ региона могут быть агрегированы (так, что им может быть назначен один класс характеристик); данные из одного набора пространственных единиц могут быть преобразованы в другие с иными пространственными очертаниями (configurations) [Muehrcke and Muehrcke, 1991]. Изучая далее геоинформатику, вы обнаружите множество ситуаций, где используется предсказание, поэтому общее понимание проблем предсказания сохранит вам время и усилия в дальнейшем.
Выборочное обследование сокращает время, необходимое на сбор данных о регионе, однако оно оставляет пробелы в нашем знании мест, не вошедших в выборку. С учетом того, что большинство ГИС-программ в значительной степени полагается на идею областей, нежели точек, мы должны быть способны определить или предсказать недостающие точечные значения. Эта необходимость обычно возникает, когда мы собираем информацию о поверхностях, используя точечные отсчеты. Чтобы получить представление о том, как выглядит поверхность полностью, для примера - поверхность рельефа, мы могли бы выбрать некоторое количество точек для измерения высоты. Когда мы смотрим на топографические карты, как контурные, так и в трехмерном представлении, отсутствующие данные не измеряются, а вместо этого пространственно предсказываются [Muehrcke and Muehrcke, 1992]. В таких случаях существуют два общих типа предсказательных моделей.
Интерполяция используется для определения недостающих значений, находящихся в пространстве между известными точками выборки. Предсказание значений за пределами области выборки на основе выявленных внутри нее закономерностей называется экстраполяцией.
Интерполяция может быть простой, при предположении, что существует линейная взаимосвязь между известными величинами и неизвестными величинами, заполняющими промежуток. Более сложные методы основываются либо на предположении о нелинейной взаимосвязи между этими величинами, либо на взвешенном расстоянии (weighted distance), когда более близкие точки считаются более значащими в предсказании недостающих значений, чем более удаленные точки. Модели подбора поверхностей (surface fitting models) включают подстановку полученных в ходе наблюдения величин в некоторое подобранное уравнение, решение этого уравнения, и затем нахождение каждого недостающего значения [Muehrcke and Muehrcke, 1992]. Эти модели полезны также и для экстраполяции, поскольку уравнение может быть легко расширено за пределы известных данных. Все эти методы позволяют предсказывать недостающие значения, однако надо помнить - предсказания это не измерения, и каждое предсказание имеет свой собственный набор проблем и ошибок. Мы рассмотрим эти методы более подробно позднее, при изучении поверхностей.
Возможна ситуация интерполяции или экстраполяции, когда задано некоторое деление на области, и точки выборки лежат не во всех имеющихся областях. Имея в наличие эти области, мы делаем предсказания о точках в других областях, которые не были отобраны, Допустим, мы определяем густоту деревьев в нескольких малых областях и хотим иметь возможность предсказания плотности в других близлежащих областях. Такая задача обычно требует от нас выполнения трех этапов. Первое, мы подсчитываем - это средние плотности во всех областях с тем, чтобы исключить влияние на них размера областей. Затем, мы присваиваем каждую величину плотности одной точке внутри каждой из этих областей (обычно некой центральной точке). Тогда, выполнив эти шаги, мы можем вернуться к методам точечной интерполяции для предсказания средних значений густоты деревьев в каждой пропущенной области.
Еще одно преобразование, которое может относиться к выборкам, должно быть рассмотрено здесь, хотя оно применимо и к полной переписи популяции. Предположим, что вы отбираете дискретные объекты, такие как местоположения животных. Отметив их положения (а в целях простоты мы предположим, что животные не движутся), вы хотите узнать, какую часть территории они обычно занимают. Другими словами, вам нужно узнать их область обитания. Это обычная задача, например, для специалистов, занятых охраной дикой природы, которые используют приборы радиотелеметрии для определения местоположений животных и часто должны иметь дело с теми ГИС, с плохим приспособлением к работе с точечными данными, но хорошо работают с площадными. Здесь могут быть применены некоторые относительно простые компьютерные методы, а также некоторые статистические подходы, которые мы позже рассмотрим подробнее.
И последнее замечание, касающееся предсказания областей с использованием наложений. Для выполнения таких штучек у нас должна быть вещь, которая упоминалась только вкратце, но будет главной темой следующей главы, а именно - карта. Карта - это основной механизм, которым мы представляем пространство вокруг нас, и в рамках которого ГИС будет работать для его анализа. И в следующей главе мы расширим наш пространственный лексикон и сделаем наш пространственный фильтр лучше, изучая, как мы можем от пространственных данных в общем, концептуальном смысле к пространственным данным в графическом смысле.
