РЕГИОНАЛЬНЫЕ БАЗЫ ДАННЫХ ДЛЯ ОЦЕНОЧНОЙ ДЕЯТЕЛЬНОСТИ
И ИХ МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ

Ахметов О.А., Мжельский М.Б.

ООО «Сибирский центр Оценки» г. Новосибирск

Статья опубликована в журнале "Имущественные отношения в Российской Федерации" №12 за 2003 г.

Процесс создания и развития правового государства включает в себя целый комплекс условий по обеспечению равных прав всем членам общества, в том числе и имущественных. При этом важнейшей задачей правового государства является обеспечение гарантий для справедливой оценки этих прав. Поэтому профессия оценщика является ответственной.

В подавляющем большинстве случаев целью оценки является определение рыночной стоимости объекта оценки. Поэтому, институт оценщиков причастен к формированию уровня рыночной стоимости на данном рынке в определенный момент времени. И, как следствие, опосредованно влияет практически на весь (как минимум региональный) рынок. Причем необходимо подчеркнуть, что деятельность одного отдельно взятого оценщика, одной отдельно взятой фирмы не оказывает на рынок заметного влияния, но весь институт оценки влияет на него. Это влияние позитивно, если оценщик на основе изучения рыночных условий и соблюдения стандартов оценки помогает выявить справедливую стоимость сделки для участников рынка, и негативно, если оценщик игнорирует или некорректно использует вышеназванные условия. При этом независимость оценщика, продекларированная во всех оценочных нормативах, может проявляться в чем угодно, но не в отношении к стандартам и методам оценки, а также данным о состоянии рынка, на котором позиционирован объект оценки. 

Отсюда следуют два условия, соблюдение которых абсолютно необходимо в деятельности института независимых оценщиков:

  1. наличие взаимно непротиворечивых, достаточных стандартов и методик, а так же корректное их использование;
  2. постоянный мониторинг и грамотная обработка рыночных данных.

Взаимная непротиворечивость стандартов и методов в данном контексте означает следующее: четкий непротиворечивый и достаточный понятийный аппарат в виде корректных формулировок часто используемых понятий; наличие методических рекомендаций, позволяющих стандартно решать самые разнообразные задачи оценки. Попробуем несколько уточнить, о чем идет речь.

Известно, что неотъемлемой частью рыночных отношений является неопределенность и связанный с ней риск. Следовательно, любые исследования, связанные с рынком (в частности, оценка) и претендующие на реальность результатов, их практическую направленность, должны использовать адекватную рынку терминологию и соответствующие рынку методы. То есть терминология, закрепленная в стандартах, должна это учитывать и быть ориентированной на неизбежную неопределенность рынка недвижимости. А используемые методы оценки должны включать в себя средства, позволяющие работать с неопределенностями и рисками.

Таким образом, стандарты и методологическое обеспечение оценочной деятельности в своей основе должны опираться на понятия и методы теорий вероятности и статистики, как раз созданных для работы в условиях неопределенности и неоднозначности.

В настоящее время в стандартах существует по сути лишь один термин, в определении которого используются понятия теории вероятности - это  «рыночная стоимость» - одно из основных понятий вообще в экономике и в оценке в частности. Но и здесь не все так просто. Дело в том, что в экономике понятие «рыночная стоимость» связывают с понятием «равновесная стоимость» (при которой объемы платежеспособного спроса и предложения на рынке совпадают). В оценочных же стандартах «рыночная стоимость» определяется, как наиболее вероятная стоимость, при которой ….. Понятно, что с принятым в экономике определением приведенный текст имеет мало общего. На самом деле они совпадают лишь в одном случае: когда для рынка справедлив нормальный (гауссов) закон распределения. Российским оценщикам не известна ни одна работа, в которой бы проверялся этот основополагающий факт. И это при том, что все методы, применяемые в практике оценки, ориентированы именно на этот закон и определяют среднюю стоимость, не имеющую никакого отношения к наиболее вероятной стоимости и совпадающую с ней опять же в случае нормального распределения. Но даже если этот закон распределения и имеет место, все равно предпочтение в определении нужно отдавать общеэкономическим понятиям. Да и придумать ситуацию, в которой не выполняется закон нормального распределения, достаточно просто. Для этого нужно на любую реальную ситуацию, имеющую место на рассматриваемом рынке, наложить ограничения вида «наилучшее», «наихудшее», «максимальное», «минимальное» и т.д. Кстати в основе оценки недвижимости лежит принцип проведения оценки для наиболее эффективного использования оцениваемой недвижимости. Но с другой стороны существуют достаточно серьезные аргументы в виде «центральной предельной теоремы» позволяющие ожидать, что в большинстве случаев нормальный закон распределения имеет место. И все же данный факт, на наш взгляд необходимо, проверить. Соответственно, основное определение, включенное в стандарт, должно иметь наиболее общую формулировку. А все остальные частные определения должны получаться из основного в качестве частных случаев.

Принимая во внимание неопределенность рынка, можно сформулировать некоторые логически обоснованные постановки задач, возникающих при работе с конкретным рынком. При формулировании задач необходимо учитывать, что неоднозначность и неопределенность рынка не позволяют получать точные и конкретные решения. В этом случае естественным результатом могут выступать лишь шансы на то, что будет выполнено какое-либо условие, или интервалы, в которых может находиться интересующая нас величина. Итак, естественные постановки задач при изучении рынка (проведении оценок на данном рынке) можно сформулировать следующим образом:

Эти же постановки, переформулированные непосредственно для целей оценки, выглядят следующим образом:

На основе приведенных формулировок можно получать большинство других имеющих практическое применение. Этот вопрос очень важен и является большой отдельной темой.

Данная же работа посвящена второму необходимому условию, сформулированному выше, а именно: постоянный мониторинг и грамотная обработка рыночных данных.

Здесь надо сделать небольшое, но важное, теоретическое отступление. Как хорошо известно, текущее положение на рынке описывается кривыми спроса и предложения (рисунок 1) :

Рисунок 1 – классические кривые спроса и предложения.

Видно, что на пересечении кривых выделяется точка равновесия и, соответствующая ей, равновесная цена.

Не вызывает также споров и утверждение, о том что рыночные характеристики всегда определяются с некоторой степенью точности. Таким образом, точное состояние рынка никогда не известно. Оно определяется лишь с некоторой вероятностью. Следовательно, вместо классических кривых спроса и предложения реально рынок можно описать (с определенной достоверностью) полосами спроса и предложения (Рисунок 2). Причем ширина полос и их форма определяются заданной необходимой достоверностью. При этом точка равновесия в соответствии с вероятностным подходом к рынку представляется уже не точкой, а некоторой областью (Ω). Понятно, что, чем больше Ω, тем больше риск значительной ошибки в определении рыночной стоимости. 

Рисунок 2 – полосы спроса и предложения, соответствующие заданному уровню достоверности

Таким образом, невыполнение хотя бы одного из двух приведенных выше условий приводит к расширению области Ω и, следовательно, увеличивает риск значительной ошибки в конечном результате оценки. 

В настоящее время практически любая, серьезно относящаяся к своей деятельности фирма, ведет или пробует вести соответствующие базы данных. Аналитическая работа с ними ограничивается, как правило, возможностями Excel и подготовкой сотрудников фирмы. Собрать рыночную информацию в электронные таблицы - это необходимое, но не достаточное условие для успешного и корректного ее использования в оценочной деятельности. 

В соответствии с предыдущими замечаниями аналитическая работа, на наш взгляд, также должна быть в определенной степени стандартизирована. Это, в первую очередь, формирование стандартных минимальных, но достаточных требований к структуре баз данных, а также разработка стандартного математического обеспечения для работы с ними. Это обеспечение должно иметь, как минимум, следующие возможности:

  1. определение ценообразующих факторов по данным однородной выборки объектов - аналогов;
  2. определение значимости (весовых коэффициентов) этих факторов;
  3. определение стоимости объекта оценки с помощью многофакторных регрессионных моделей; 
  4. определение ставки капитализации с помощью обработки баз данных рынка аренды и рынка продаж.

При разработке математического обеспечения нельзя забывать о том (как это отмечалось выше), что все результаты имеют вероятностный характер и обеспечение должно это учитывать.

В силу упомянутого вероятностного характера результатов обработки необходимо уточнить, что список ценообразующих факторов (особенно вместе с весовыми коэффициентами значимости) также имеет вероятностный характер. То есть, список факторов и их рейтинг по влиянию на стоимость объекта не является жестким. Так при 10-ти ценообразующих факторах рейтинг между ними может значительно изменяться от измерения к измерению. Например, если i-й фактор с вероятностью 0,9 превосходит (i+1) –й для любого значения i. Как видно в этом случае взаимное расположение соседних факторов практически достоверно. Но в случае, когда они рассматриваются все вместе, общее заданное взаимное расположение имеет вероятность всего 0,35. Видно, что в приведенном примере заданное взаимное расположение ценообразующих факторов имеет достаточно низкую вероятность, т.е. при повторном измерении надеяться на получение того же рейтинга не стоит, скорее всего, он будет иным. И это не ошибка в методике или качестве проведенных измерений, просто эта неоднозначность является следствием общей неоднозначности рынка.

Структура обеспечения работы с базами данных должна быть открыта для пополнения возможностей.

Рассмотрим основные этапы по созданию подобных баз и проблемы, возникающие при этом.

1-й этап. Существуют два различных подхода к решению поставленной задачи:

  1. разработка аналитических программ, самоадаптирующихся к произвольным базам данных;
  2. разработка единой (типовой) формы базы данных и создание под нее аналитических инструментов, а также создание программ по переводу различных баз в типовую.

В представленной работе отдано предпочтение второму варианту.

При этом на первом этапе формируется модель типовой базы с последующим приведением конкретной базы к типовой. 

2-й этап. Приведение типовой базы к виду удобному для аналитической обработки.

Здесь решаются две основных задачи.

Вначале по основной переменной выборка разделяется на однородные части (области, группы). Поскольку понятие однородности зависит от поставленной цели анализа, то возможны различные формулировки:

Определять границы однородных частей базы по функциям распределения можно двумя способами:

В данной работе выбран второй вариант, позволяющий сразу быть уверенным, что при проведении вычислений полученная оценка будет удовлетворять заданным требованиям точности.

Другой задачей является оцифровка значений нецифровых текстовых характеристик. Эта операция является обязательной, т.к. многие информационные поля имеют нечисловой вид (например: «район», «адрес» и др.), но сравнивать их тем не менее необходимо. При этом присвоение нечисловым значениям текстовых характеристик каких-либо числовых значений не может быть произвольным. Действительно, пусть в базе объекты-аналоги расположены в районах «А», «Б», «С» и «Д», причем значение стоимости объектов соответственно равнялись 1; 2; 3 и 4 (рисунок 3). Тогда, придавая различные числовые значения районам, будем получать различные виды зависимостей стоимости объекта от района расположения.

Рисунок 3 – Вид функции в зависимости от порядка нумерации районов.

На примере видно, что изменение порядка нумерации районов приводит и к изменению функциональной зависимости. 

Между тем существует достаточно простое правило, позволяющее в первом приближении решить проблему оцифровки: «значения, приписываемые нечисловой характеристике, должны соответствовать поведению основной переменной (в нашем случае стоимости). То есть, тем значениям характеристики, которым соответствует меньшая стоимость, приписываются и меньшие (или большие) числовые значения».

Это простое правило, работающее в иных условиях, для рынка недвижимости годится лишь в качестве первого приближения. Действительно, в каждом районе встречаются объекты различной стоимости и, следовательно, однозначное приписывание числовых значений становится проблематичным.

Итак, на втором этапе типовая база делится на однородные части и проводится оцифровка нечисловых характеристик.

3-й этап. На этом этапе на основе типовой базы формируется модификация базы, предназначенная для решения поставленной аналитической задачи.

Практически для решения всех перечисленных выше задач необходимо сопоставление изменений характеристик с изменением основной рыночной характеристики (в данном случае – стоимости). Таким образом, выбрав в качестве базовой любую произвольную информационную строку типовой базы, для любой другой строки определяются изменения всех характеристик.

Итак, на третьем этапе формируется база изменений относительно фиксированной базовой строки.

4-й этап. На этом этапе, используя различные методы «уравнения регрессии», «метод наименьших квадратов» и другие, определяется значимость вклада изменений отдельных характеристик в изменение основной.

При этом автоматически формируются и коэффициенты уравнения для оценки стоимости данного объекта.

Необходимо сделать несколько замечаний. Как отмечалось выше, каждая конкретная «оцифровка» нечисловых характеристик влияет на точность конечного результата. Поэтому среди всех возможных способов «оцифровки» нужно найти разумный, позволяющий решать задачу с заданной степенью точности. При этом авторы статьи отказались от традиционных, рекомендуемых в литературе, способов поиска «оцифровки» и применили иной способ, в основу которого положена комбинация методов «Монте-Карло» и сканирование по поверхности. Это позволило существенно уменьшить среднюю ошибку результата.

В настоящее время все описанные алгоритмы реализованы, что является подтверждением возможности решения поставленной задачи.

Рассмотрим пример реализации предложенных алгоритмов.

В качестве полигона для проверки потенциальной возможности создания программ, реализующих предложенные алгоритмы, использовалась база данных по ценам предложений однокомнатных квартир в г. Новосибирске. Выбор базы определялся тем, что в настоящее время в Новосибирске базы по квартирам являются наиболее сформированными и отвечающими предъявляемым требованиям.

Фрагмент базы представлен в таблице 1:

Таблица 1 – Исходная база данных.
Р-н Ул дом Тип этаж Этажность материал общая жилая кухня Тел Балкон/Лод Сан узел Цена
Дзж Гусинобродское шоссе 33 Тип 2 9 кир 36 22 6,1 + Л С 500
Дзж Гоголя 194 Тип 3 9 пан 31 17 5,5 - Б С 540
Дзж Учительская 8/1 УП 9 10 кир 39 19 9 - Б С 600
Дзж Гоголя 189 Мэ 1 3 кир 30 16 6 - - С 430
Дзж Учительская 8 УП 1 10 кир 33 17 8 - - С 800
Дзж Селезнева 40 ПГ 3 3 кир 37 19 8 - - С 550
Дзж Авиастроителей 12 ПГ 1 5 кир 42 22 12 + - С 530
Дзж Экономическая 5 Мэ 1 2 Шбл 31 22 5,3 + - Р 320
Дзж Гоголя 194   9 9 пан 30 17 6 - Л С 550

Полная база содержит 457 записей со стоимостями от 160 т.р. и до 850 т.р. После выделения «однородных» частей (при этом требовалось, чтобы ошибка не превышала 7,5%) база разбивается на две области:

- 160 до 500 т.р.

- 500 до 850 т.р.

Дальнейшая работа проводилась с каждой областью отдельно (обе области были представлены примерно 228 представителями). 

Промежуточная база перед непосредственной представлена в таблице 2:

Таблица 2 – Пример промежуточной базы данных.
Цена Р-н тип этаж Этажность материал общая жилая Кухня Тел Балкон/Лод Сан узел
425 Кир УП 2 9 пан 33 12 9 - Б Р
425 Кир хр 5 5 пан 30 16 6,1 + Б С
425 Сов мэ 2 2 дер 31 19 5,5 + Б С
430 Дзж мэ 1 3 кир 30 16 6 - - С
430 Дзж хр 5 5 кир 30 16 6 + - С
450 Кир УП 5 9 пан 30 13 9 + Б Р
450 Кир УП 9 9 кир 36 18 9 - Л Р
450 Кир хр 5 5 пан 31 19 6 - Б С
450 Кир тип 5 9 кир 33 18 7 + - С

Именно эта база в дальнейшем подвергается оцифровке и соответствующей обработке.

В результате одной из оцифровок была получена таблица 3:

Таблица 3 – Результат оцифровки.
Цена Р-н тип этаж Этажность материал общая жилая кухня Тел Балкон/Лод Сан узел
425 1 20,8 2 9 49,8 33 12 9 35,6 55,2 5
425 1 8 5 5 49,8 30 16 6,1 34,2 55,2 21,6
425 34,6 21,6 2 2 30,6 31 19 5,5 34,2 55,2 21,6
430 1,8 21,6 1 3 46,8 30 16 6 35,6 58,4 21,6
430 1,8 8 5 5 46,8 30 16 6 34,2 58,4 21,6
450 1 20,8 5 9 49,8 30 13 9 34,2 55,2 5
450 1 20,8 9 9 46,8 36 18 9 35,6 25,8 5
450 1 8 5 5 49,8 31 19 6 35,6 55,2 21,6
450 1 0,4 5 9 46,8 33 18 7 34,2 58,4 21,6

При этом оцифровка подбиралась, исходя из требования минимизации средней ошибки определения цены по всей базе. Ниже приведена оцифровка, позволяющая достичь точности 7,5% (последняя строка таблицы) на первом интервале (таблица 4) :

Таблица 4 – Варианты различных оцифровок.

  Район тип Материал Тел. Балкон/Лоджия
ср.ош. Дзж Жел Злц Клн Кир Лен Окт Прв Сов Цен тип УП хр ПГ элт кир пан шб мон Дер + - Л Б - Б+Л
0,21 2 39 25 20 1 10 28 1 35 40 21 28 23 19 20 29 4 15 39 19 48 41 2 34 45 2 26
0,075 32 8 17 13 29 25 12 23 12 7 14 3 17 11 28 29 4 15 39 19 27 32 14 19 8 25 16

Кроме того, в таблице 4 (в первой строке) приведена оцифровка, в которой значения, приписываемые районам, расположены по увеличению их влияния на стоимость, как это рекомендовано в литературе. Но при этом средняя ошибка результата значительно увеличилась и стала равной 21%.

Целью и результатом данной обработки выделенного массива данных являлось определение ценообразующих факторов и определение коэффициентов регрессии для оценки стоимости квартиры. 

Соответствующие коэффициенты и степени значимости характеристик приведены в таблице 5:

Таблица 5 - коэффициенты и степени значимости характеристик для оцифровок таблицы 4

ср. ошибка   Р-н тип этаж Этажность материал общая жилая кухня Тел Балкон/Лод Сан узел
0,075 Коэф. ур. -0,14 -1,65 -0,18 5,21 0,0048 3,22 1,00 3,20 -3,46 1,39 -1,38
Значим. 0,0055 0,0515 0,0022 0,0639 0,0001 0,0656 0,0118 0,0239 0,0445 0,0371 0,0604
Рейтинг 9 5 10 3 11 2 7 4 1 6 8
0,21 Коэф. ур. 1,79 0,02 4,76 5,99 0,42 0,63 0,05 5,45 1,90 1,07 14,64
Значим. 0,05 0,0004 0,03 0,07 0,03 0,03 0,001 0,06 0,11 0,08 0,41
Рейтинг 6 11 9 4 8 7 10 5 2 3 1

Как видно из таблицы 5, способы оцифровки влияют на все дальнейшие результаты, при этом изменяется не только точность, но и список ценообразующих факторов, а также коэффициенты регрессионного уравнения.

Если в первом варианте характеристики «общая», «этажность», «телефон», «кухня» определяют изменение стоимости на 74%, то во втором варианте это же влияние обеспечивается характеристиками «санузел», «телефон», «балкон/лоджия», «этажность», «кухня». Списки ценообразующих факторов существенно различаются.

Ниже приведена оцифровка, позволяющая достичь точности 7,5% (первая строка таблицы) на втором интервале, соответствующем более дорогим квартирам (таблица 6):

Таблица 6 – Оцифровки для заданной точности в обеих областях разбиения базы.

  Район тип Материал Тел. Балкон/Лоджия
ср.ош. Дзж Жел Злц Клн Кир Лен Окт Прв Сов Цен тип УП хр ПГ элт кир пан шб мон дер + - Л Б - Б+Л
0,075/2 28 3 13 19 26 23 17 21 15 11 6 9 22 20 5 14 3 17 11 28 27 32 18 14 8 15 11
0,075/1 32 8 17 13 29 25 12 23 12 7 14 3 17 11 28 29 4 15 39 19 27 32 14 19 8 25 16

Соответствующие коэффициенты и степени значимости характеристик приведены в таблице 7:

Таблица 7 - Коэффициенты и степени значимости характеристик.

ср. ошибка   Р-н тип этаж Этажность материал общая жилая кухня Тел Балкон/Лод Сан узел
0,075
1
Коэф. ур. -0,14 -1,65 -0,18 5,21 0,0048 3,22 1,00 3,20 -3,46 1,39 -1,38
Значим. 0,0055 0,0515 0,0022 0,0639 0,0001 0,0656 0,0118 0,0239 0,0445 0,0371 0,0604
Рейтинг 9 5 10 3 11 2 7 4 1 6 8
0,075
2
Коэф. ур. -3,328 0,352 -5,190 6,536 2,828 5,960 -3,615 0,184 -1,391 2,027 1,179
Значим. 0,080 0,007 0,045 0,055 0,061 0,100 0,031 0,003 0,010 0,023 0,048
Рейтинг 3 10 9 4 8 1 2 11 5 7 8

Как видно из последних двух таблиц, обе части базы, полученные в результате разбиения на «однородные» по ограничению на допустимую ошибку, довольно сильно отличаются друг от друга. Прежде всего они должны по разному оцифровываться, эти области имеют различные коэффициенты регрессионных уравнений. И, соответственно, одни и те же характеристики имеют различные уровни значимости. Таким образом, состав основных ценообразующих факторов различен в разных областях базы. И это достаточно очевидно, так как шкалы ценностей для людей, покупающих дешевые и дорогие квартиры различны. 

Для практического применения полученных уравнений необходимо также определить оцифровку позволяющую минимизировать среднюю ошибку по всей базе. И для этой оцифровки определить коэффициенты регрессионного уравнения для всей базы.

В рассматриваемом примере подобная оцифровка приведена ниже (таблица 8). Эта оцифровка позволяет получить среднюю точность по всей базе примерно 11%.

Таблица 8 – Оцифровка для всей базы.

  Район тип Материал Тел. Балкон/Лоджия
ср.ош. Дзж Жел Злц Клн Кир Лен Окт Прв Сов Цен тип УП хр ПГ элт кир пан шб мон дер + - Л Б - Б+Л
0,11 38 1 7 10 33 24 11 24 8 8 8 10 35 4 4 20 11 14 0 13 5 25 25 33 40 14 23

Эта вспомогательная операция и соответствующее регрессионное уравнение позволяют по входным характеристикам недвижимости получить первую предварительную оценку ее стоимости. По этой оценке определяем, в какую группу (область) разбиения входит данная недвижимость. И уже после этого, используя соответствующее регрессионное уравнение, получаем окончательную оценку данной недвижимости.

В качестве примера из имеющейся базы были произвольно выбраны две квартиры со стоимостями 390 и 700 тыс. руб. Их стоимость, оцененная по соответствующим характеристикам с помощью общего уравнения, получилась равной 428 тыс. руб. (ошибка 9,8%) и 665,6 тыс. руб. (ошибка 4%). По этим данным первая квартира была отнесена к первой группе, а вторая ко второй. Применив к ним оцифровки и регрессионные уравнения соответствующих областей, получили следующие оценки стоимости этих квартир:

397,6 тыс. руб. (ошибка 1,95%);

699,04 тыс. руб. (ошибка 0,14%).

Видно, что подобная процедура позволила значительно уменьшить ошибку и, соответственно, повысить точность оценки.

Таким образом, общая последовательность работы с индивидуальными базами данных проходит четыре этапа:

  1. приведение конкретной базы к типовому виду;
  2. выделение «однородных» областей и «оцифровка»;
  3. формирование базы изменений характеристик;
  4. определение значимости отдельных характеристик для каждой выделенной области;
  5. определение регрессионных уравнений стоимости для выделенных областей.

В заключение отметим, что конкретные значения получаемых ошибок объективно зависят от «разболтанности» рынка, т.е. от степени его неопределенности, его уровней риска. А эта «разболтанность» определяется, как отмечалось выше, не только внешними факторами, но и совместной работой всех оценочных фирм, их стандартами и методическим обеспечением. В данной работе сделана попытка, построить единообразный алгоритм обработки собранных рыночных данных и объединенных в виде некоторой базы данных. При этом подобное единообразие нисколько не ограничивает возможности применения других аналитических подходов, иных критериев и целей. Карта

rss
Карта