Koronawirus nie pozostaje bez wpływu na wiele rynków. Wprowadzony przez rząd stan zagrożenia epidemicznego wiąże się z zakazem najmu krótkoterminowego, przez co w Warszawie do odwołania nie może działać Airbnb. Jednak spłaty kredytów nie zostały zawieszone przez państwo jak we Włoszech, a czynsze wciąż trzeba płacić, podczas gdy epidemia wydaje się nie odpuszczać. Właściciele mogą być pozbawieni dochodów jeszcze przez miesiące. Na portalach ogłoszeniowych błyskawicznie pojawiły się mieszkania na wynajem długoterminowy, które jeszcze niedawno były dostępne na Airbnb. Aby sprawdzić, ile takich ogłoszeń zostało opublikowanych, porównaliśmy główne zdjęcie ofert na Airbnb sprzed kilku miesięcy ze zdjęciami z ogłoszeń wynajmu mieszkań dostępnych na otodom i Gumtree.
Łukasz Nawaro, Analityk DELab UW
Łatwo sprawdzić, czy zdjęcia są identyczne. Wystarczy jednak drobna zmiana, aby zdjęcia przedstawiające to samo nie były dokładnie takie same, np. otodom do każdego zdjęcia dodaje własny znak wodny. Z pomocą przychodzi hashing, czyli algorytm przyporządkowujący liczbę (tradycyjnie zapisywaną systemem szesnastkowym) do dowolnego pliku, w tym obrazów. Odmiana haszowania, którą wykorzystujemy to perceptual hashing.
Haszowanie wykorzystywane jest między innymi w kryptografii. Typowe algorytmy haszujące (np. MD5) są zaprojektowane tak, aby drobna zmiana w danych wejściowych powodowała drastyczną zmianę wyniku procesu. Dla przykładu, MD5 tekstu Inwokacji to 6b293ee472ccc0bd57a8e9956714eb1d, po zmianie jednego znaku (“grysze” zamiast “grusze”) MD5 to a9cd76abd0ef604f40c70f5029c8162d. Dzięki temu możemy łatwo sprawdzić, czy tekst został dokładnie przepisany lub czy kod programu został poprawnie pobrany ze strony internetowej. Dowolny algorytm kryptograficzny (SHA-1, BLAKE itd.) powinien zachowywać się tak samo.
Dla naszych zastosowań potrzebujemy, aby niewielka zmiana w danych wejściowych powodowała tylko niewielką zmianę na wyjściu, czyli w ostatecznym haszu. Hasz służy nam do zmniejszenia ilości porównywanych danych. W ten sposób niewielkie modyfikacje, których się spodziewamy, nie spowodują drastycznej zmiany wyniku, i w zależności od wybranej tolerancji uznamy tekst lub zdjęcie za “dostatecznie” podobne. Dobranie odpowiedniego rozmiaru hasza i tolerancji to bardziej sztuka niż nauka – nie możemy dokładnie sprawdzić efektywności algorytmu. Użyliśmy algorytmu phash z biblioteki ImageHash z hash_size 12 i pozwoliliśmy na maksymalnie 35 bitów różnicy między haszami. Pozwoliło to całkowicie wyeliminować fałszywe pozytywne wskazania podobieństwa na wstępnych, testowych danych. To ustawienia raczej ostrożne, dobrane tak, aby ułatwić nam pracę. Przykładowe zmiany, które przynajmniej w niektórych przypadkach nie powodują nadmiernej zmiany wartości hasza, to przeskalowanie obrazu, dodanie znaku wodnego, rozjaśnienie obrazu, obracanie kadru, drobne ucięcie czy dodanie niewielkich pasków z góry i dołu.
Użyliśmy prawie 150 tysięcy unikalnych zdjęć dotyczących 18 tysięcy ofert z portali ogłoszeniowych, a wszystkie zdjęcia zajęły 13 gigabajtów miejsca na dysku. Pobraliśmy listę ogłoszeń dwa razy (raz w weekend 21-22 marca, raz w czwartek 26 marca). Dane dotyczące 17,5 tysiąca ofert Airbnb pochodzą z bazy AirDNA z września 2019 – jedna z kolumn zawierała link do głównego zdjęcia wyświetlającego się w danym ogłoszeniu najmu krótkoterminowego, w zdecydowanej większości przypadków ten obraz był wciąż dostępny. Pierwsze zdjęcie musi być zachęcające (kolejne mogą dotyczyć np. ręczników lub widoku z okna, mniej istotnych dla najmu długoterminowego), dlatego zakładamy, że zostało ponownie wykorzystane – ale niekoniecznie jako główne. W naszych wynikach – na podstawie wyłącznie głównego zdjęcia Airbnb – znaleźliśmy 461 mieszkań, które były wcześniej wystawione na Airbnb, a obecnie są możliwe do wynajęcia na jednym z dwóch portali na rynku długoterminowym. Na rynek trafiają zarówno mieszkania ze Śródmieścia, jak i z odległych dzielnic.
Warto zauważyć, że spora część ogłoszeń na otodom dotyczy najmu “średnioterminowego”, z promocjami kończącymi się w określonym terminie. Zostało opublikowanych aż 98 takich ogłoszeń. Właściciel(e) ma(ją) najwyraźniej nadzieję na przeczekanie trudnego okresu i powrót na Airbnb po uspokojeniu się sytuacji. Świadczy to też o profesjonalizacji rynku Airbnb, gdyż wszystkie ogłoszenia ze “średnioterminowy” w tytule mają znak wodny tej samej agencji.
Mamy świadomość ograniczeń naszego badania. Idealne dobranie wartości parametrów do porównywania zdjęć jest trudne, a niektóre firmy wprowadzają agresywne znaki wodne. Zbieraliśmy dane tylko w tym tygodniu, przez co jeśli mieszkanie przeszło na rynek długoterminowy wcześniej, nie zostało uwzględnione. Nie porównaliśmy dalszych zdjęć z Airbnb. Nie sprawdziliśmy, czy mieszkania trafiły na sprzedaż. Dodatkowo niektórzy mogli ogłaszać się tylko przez inne portale (przede wszystkim Facebooka i OLX). Nie zbudowaliśmy też zaawansowanego systemu sztucznej inteligencji sprawdzającego, czy pokoje ze zdjęć są identyczne, tak więc jeśli zostały zrobione nowe zdjęcia (bardziej dostosowane do najmu długoterminowego), nie znaleźliśmy tego. Ręcznie usunęliśmy false positives. Niemniej jednak to wszystko oznacza, że nasze szacunki są ostrożne i jeśli się pomyliliśmy, ta liczba jest niedoszacowana – w połączeniu z nieuwzględnionymi ogłoszeniami, sprzedażą itd. być może trzeba byłoby mówić o tysiącach mieszkań. Wciąż w porównaniu do zasobów mieszkaniowych Warszawy nie będzie to wielka liczba (za wyjątkiem Śródmieścia, gdzie miejscami co kilkadziesiąt metrów można znaleźć mieszkanie dawniej wynajmowane na Airbnb), ale w połączeniu z możliwymi upadkami wielu sektorów usług – a co za tym idzie, wyjazdami ludzi z Warszawy do miejsc pochodzenia – może mieć znaczenie dla miasta. Wszystko zależy od szybkości opanowania pandemii, działań rządu i skali nadchodzącego kryzysu.
Zainteresował Cię artykuł? Przeczytaj raport o Airbnb w Warszawie!
Niebieski: mieszkania, które są dostępne na Gumtree lub otodom. Czerwony: losowo wybrany podzbiór innych ofert z Airbnb.