Otel Oda Fiyatlarını Açıklamada Makine Öğrenmesi Algoritmalarının Kıyaslanması (Comparison of Machine Learning Algorithms in Explaining of Hotel Room Prices)     
Yazarlar (1)
Dr. Öğr. Üyesi Yılmaz AĞCA Tokat Gaziosmanpaşa Üniversitesi, Türkiye
Makale Türü Açık Erişim Özgün Makale
Makale Alt Türü Ulusal alan endekslerinde (TR Dizin, ULAKBİM) yayınlanan tam makale
Dergi Adı İşletme Araştırmaları Dergisi
Dergi ISSN 1309-0712
Dergi Tarandığı Indeksler TR DİZİN
Makale Dili Türkçe
Basım Tarihi 03-2021
Cilt No 13
Sayı 1
Sayfalar 450 / 463
DOI Numarası 10.20491/isarder.2021.1144
Makale Linki http://dx.doi.org/10.20491/isarder.2021.1144
Özet
Amaç – Çalışmada, makine öğrenmesi algoritmalarından bazılarının, web madenciliği ile elde edilen büyük veri kullanılarak, analiz edilmesi ve otel oda fiyatlarını açıklama performanslarının test edilmesi amaçlanmaktadır. Böylelikle otel oda fiyatlarını en doğru açıklayan modelin belirlenmesidir.Yöntem – Verinin elde edilmesinde web madenciliği/web kazıma yöntemi kullanılmıştır. Hedef web sitesi geliştirilen bir algoritma yardımıyla yaklaşık altı ay boyunca taranmış ve elde edilen 6558 konaklama tesisine ait veriler, analizlerde kullanılmıştır. Araştırmanın ikinci kısmı istatistiksel analizlerden ve makine öğrenmesi algoritmalarının uygulanmasından oluşmaktadır. Analizlerin yapılması ve algoritmaların uygulanması için Python programlama dili kullanılmıştır. Bu dile ait kütüphaneler, pandas, numpy veri işleme için, seaborn, matplotlib grafikler ve görselleştirme için, scikit-learn ise makine öğrenmesi algoritmaları için kullanılmıştır. Analizlerden sonra veri için en uygun olduğu düşünülen lojistik regresyon ile bir model oluşturulmuştur.Bulgular – Karşılaştırılan Rassal Orman ve Karar Ağacı algoritmalarının her ikisinin de yaklaşık %99,89 oranında veri setini açıkladığı dolayısıyla ağaç/dallanmaların başarı ile gerçekleştiği görülmektedir. KNN algoritması ise en yüksek performansı üç kümeli bir sınıflandırma ile %62,12 oranında gerçekleştirmiştir. Doğrusal sınıflandırma yöntemini kullanan Lojistik Regresyon, Olasılıksal Dereceli Azalma ve Destek Vektör Makineleri algoritmalarından en yüksek skoru %39,13 ile lojistik regresyon yöntemi elde etmiştir. Lojistik regresyon ile oluşturulan modelde, konukların tesise verdikleri puan, tesisin bölgede diğer tesisler arasındaki sırası, tesisin türü ve bulunduğu şehir istatistiki olarak anlamlı bulunmuştur (p<0,05).Tartışma – Araştırma sonucunda, elde edilen makine öğrenmesi performans skorlarının yanı sıra, Türkiye’de otel oda fiyatları hakkında önemli bilgiler elde edilmiştir. Oluşturulan regresyon modeli ile 44 bağımsız değişkenden hangilerinin otel oda fiyatlarını açıklamada anlamlı olduğu ortaya konulmuştur.
Anahtar Kelimeler