Чому ми будуємо аналітику нерухомості на відкритих оголошеннях, а не чекаємо на «ідеальні» дані
Найчастіше нас просять про одне й те саме: «Покажіть реальні ціни продажу». І чесна відповідь щоразу одна. Таких відкритих даних в Україні просто немає.
Спершу це звучить дивно. Держреєстр речових прав справді знає, за скільки квартира перейшла з рук у руки. От тільки дістати цю інформацію можна лише пооб'єктним витягом, через нотаріуса або «Дію», по конкретній адресі та конкретному правочину. Зведеної бази цін угод по місту чи району не існує. Ні в держави у відкритому доступі, ні в приватних компаніях, ні в когось «зі знайомих». Тож коли вам обіцяють «базу реальних продажів по Києву», напрошується зустрічне запитання: а звідки вона взялася?
По чому ж тоді працюють усі
По оголошеннях. Усі. DOM.RIA, ЛУН, оцінювачі з багаторічним стажем, банки, які приймають квартиру в заставу. Усі дивляться на те, що виставлено на продаж, бо це єдиний масив цін, який оновлюється щодня й доступний без посередника. Питання навіть не в тому, ідеальне це джерело чи ні. Воно неідеальне, і ми перші це визнаємо. Питання в іншому: чи можна витягнути з нього чесний сигнал, якщо підійти до справи акуратно.
Ми вважаємо, що можна. Навколо цієї відповіді й побудований весь продукт.
Що насправді показує пропозиція
Підписуйтеся на наші соцмережі
Найкращий публічний сигнал ринку, доступний в Україні зараз, це динаміка пропозиції. Скільки об'єктів зараз активні. Скільки нових з'явилося за тиждень. Хто знизив ціну і на скільки. Куди повзе медіана по конкретному сегменту: однокімнатні в певному районі, будинки в радіусі кількох кілометрів від точки.
Окреме оголошення вам мало що скаже. Продавець може хотіти будь-чого, повісити цінник зі стелі, місяцями не рухатися з місця. Але коли ви дивитеся на сотні об'єктів одночасно, день за днем, картина випрямляється. Стає видно, де ціни тримаються, а де продавці вже почали поступатися. Видно, що в одному будинку висить п'ять майже однакових квартир (а отже, реальна планка нижча за найдорожчу з них). Саме це ми й відстежуємо: системно, одразу з кількох майданчиків (OLX, DOM.RIA, Otodim, RIELTOR), щодня.
Чому це не «ще один парсер»
Зібрати оголошення вміє багато хто. Цінність не в самому добуванні даних. Сирі оголошення, по суті, брешуть: тут дублі, там фантазійні цінники, а десь один пентхаус, який сам по собі зрушить будь-яке середнє вгору. Цінність у тому, що відбувається поверх цих даних. Методологія тут проста, але вперта, і важить вона більше за сам факт парсингу.
Спершу дедуплікація. Одне й те саме оголошення часто живе одразу в кількох місцях. Бувають точні дублі (один майданчик, один ID), бувають майже-дублі (той самий об'єкт, перевиставлений окремим оголошенням), а бувають кросплатформені, коли квартира висить на OLX і на DOM.RIA водночас. Якщо їх не прибрати, медіана поповзе туди, де об'єкт випадково засвітився частіше.
Далі відсів викидів. Ми застосовуємо робастне правило IQR: відкидаємо те, що випадає за межі звичайного діапазону цін у вибірці. Не вгадуємо «на око», а рахуємо. На маленькій вибірці статфільтр не вмикаємо взагалі, бо на трьох об'єктах будь-яка «статистика» це самообман.
Потім медіана замість середнього. У ринку оголошень важкі хвости, і середнє легко перекосити одним дорогим лотом. Медіана плюс p25 і p75 чесніше описують, де реально стоїть більшість. Ціну при цьому ми приводимо до гривні за курсом НБУ, щоб ви не перераховували долар руками.
І останнє, мабуть, найважливіше. Коли вибірки замало, ми про це прямо кажемо: ставимо прапорець низької впевненості, а не видаємо цифру за повноцінну оцінку. Сирі оголошення брешуть. Прибраний шум показує ринок. Уся робота в тому, щоб перетворити одне на інше й не збрехати по дорозі.
Де проходить чесна межа
Ми навмисно не називаємо результат «точною ринковою вартістю» і не обіцяємо «всю базу України». Ні те, ні інше нам не належить, і вдавати протилежне було б нечесно. Те, що ми даємо, це ціни пропозицій. Перевірений, очищений масив того, що виставлено на ринок, з посиланнями на джерела й методологією, як він зібраний. На ринку, де закритих даних немає в принципі, системно прочитана пропозиція це сильна позиція. Не друга за якістю, а просто чесна. Тому ми її й не маскуємо під щось більше.
Чому зараз це важить більше, ніж рік тому
Ринок стиснувся. Активних оголошень про продаж стало помітно менше, ціни підросли, а вікна можливостей покороткішали: те, що ще недавно висіло місяцями, тепер часом іде за тижні. Коли пропозиція щільна, можна дозволити собі неспішно гортати вкладки. Коли її мало і вона швидко рухається, ручний моніторинг просто не встигає. Системний моніторинг не ухвалює рішень за вас. Він просто прибирає розрив між тим, що відбувається на ринку, і тим, що ви про це знаєте сьогодні зранку.
Подивитися, як це виглядає
На parsekeep.com/mini можна за пару хвилин зібрати безкоштовний міні-зріз по своєму сегменту: кілька аналогів, медіана, грн/м², p25 і p75, топ знижень ціни. А як виглядає повний звіт, видно тут.
Вперше опубліковано в блозі ParseKeep: parsekeep.com/blog/chomu-vidkryti-dani