İzlediğim filmler verisi ne söylüyor?

date
Jan 14, 2021
slug
izledigim-filmler-verisi-ne-soyluyor
status
Published
tags
data
personal
movie
summary
2011 yılında üye olduğum IMDb’de izlediğim filmleri eklediğim ve oyladığım bir listem var. Listedeki verilerin bana neler söylediğine kısaca bakmak istedim.
type
Post
2011 yılında üye olduğum IMDb’de izlediğim filmleri eklediğim ve oyladığım bir listem var. Listedeki verilerin bana neler söylediğine kısaca bakmak istedim. IMDb listenizi hesabınızdan .csv formatında indirebiliyorsunuz. Python kütüphanelerinden Pandas ile yüklediğim .csv dosyasını yine bir Python kütüphanesi olan Seaborn ile basit de olsa görselleştirdim. Bakalım izlediğim filmler verisinde neler var.
Kaynak dosyasından erişebildiğiniz hesaplamalara göre bu yazının yayınlandığı tarih itibarıyla listemde -kısa film, dizi gibi türler de dahil- 279 film varmış. Bu filmlerin IMDb puanlarının ortalaması 7.7 iken benim puanlarımın ortalaması 7.2'ymiş. Filmlerin süresi ortalama 127 dakika. (Şimdi 127 demişken 127 Hours filmi aklıma geldi, izlerken bayılmıştım, ciddi anlamda. Başka zaman anlatırım.) Her birini en az bir defa izlemiş olsam toplam izleme sürem 35.055 dakika. Yani 584 saat, o da yapar 24 gün. (Üzerime toprak atın.)
Oylama yaptığım tarihleri incelerken, daha doğrusu görselleştirirken 2012 yılından sonra tam 5 yıl listeye hiçbir şey eklemediğimi fark ettim. Verileri keşfetmeye çalışırken yaptığınız görselleştirmeler tam da bu fark etmeleri sağlar. Zaten bir veriyi anlamanın en kolay yolu; onu satırlar halinde okumak değil, şekiller ve renkler yardımıyla görmektir. Huyumuz bu, doğamızda var. (Bazıları şekilciliğe karşı olup satırcı olabiliyor, onlar ayrı.)
notion image
Grafiğin zaman aralığı filmleri benim oylama yaptığım tarihlerden oluşuyor. 2018'den sonra kullandığım liste bana arada izleyip de listeye eklemediğim filmlerin de olabileceğini söylüyor -5 yıl boyunca film izlememiş değilim. Listeyi ne zamandan beri güncel tuttuğum adına iyi bilgi bu. Aşağıdaki grafikse filmlerin çıkış yılı baz alındığında IMDb puanlarının durumu.
notion image
2000 sonrası çıkan filmler listemde çoğunlukta. Eskilerden izlediğim filmler çok nadir. IMDb puanları olarak da dağınık bir görüntü var. Burada dikkatimi çeken başka bir şey dizilerin yüksek puanlı olması. Diziler doğaları gereği IMDb’de zaten yüksek puanlı ama burada benim de bilinçli bir tercihim var. Tavsiye üzerine başlamış da olabiliyorum dizilere ama çoğunlukla en iyi oyları almış dizilere öncelik veriyorum. Bir de filmlerin çıkış yılına göre benim puanlarıma bakalım.
notion image
Yukarıdaki grafikte bariz olarak gördüğüm şey puanlamada bonkör davranmış olmam. IMDb puanlarındaki dağınıklık burada yüksek puanlara doğru kaymış gözüküyor. Öyle ki 9'lu puanlarda elimi korkak alıştırmamışım. İnsanların sevmeyip de benim çok sevdiğim filmlerin olduğu anlaşılıyor. Burada şunu merak ediyorum: Acaba IMDb puanlarıyla benim puanlarım arasında anlamlı bir ilişki var mı? Yani insanların genel olarak sevdiği şeyleri ben de seviyor muyum? Bunun için korelasyonaihtiyacımız var.
Bilenler parmak kaldırmasın, korelasyon hesabına göre iki şey arasındaki ilişkinin korelasyon değeri 0 ile 1 arasındaysa ve bu 1'e yaklaşıyorsa pozitif anlamda bir ilişki olduğunu düşünürüz. Korelasyon hesabında çıkan 0.54, IMDb puanlarıyla benimkiler arasında pozitif bir ilişki olduğunu söylüyor. Çok anlamlı mı? Sayılır, ortanın biraz üzerinde, yükseğe yakın. Yani IMDb puanları yüksekse benim de yüksek puan verme ihtimalim yükselmiş oluyor. Başka hangi değerler arasında ilişki var onlara da bakalım, merak ettim.
notion image
IMDb puanlarıyla benim puanım arasındaki ilişkiyi burada da görebiliyoruz: En açık turuncu olan kutu, en alt sırada soldan üçüncü. Turuncu olanları incelemeye devam edelim. Kullanılan oy sayısıyla IMDb puanı arasında da iyi sayılabilecek anlamlı bir ilişki var. Yani kullanılan oy sayısı ne kadar fazlaysa IMDb puanları da yükseliyor diyebiliriz. Benim oylarımla kullanılan oy sayısı arasında da eh işte denibilecek bir ilişki var ama en açık turuncu olan kadar değil. Sonuçta benim oyum ile dağdaki ço…

En çok ve en az oy alan filmler ile yönetmenler

notion image
En çok kullandığım oylar buradan da görüldüğü üzere 7 ve 8. Muhtemelen 7'den düşük olanlardaki duygu durumum yuh bu ne rezalet ya olabilir. 9konusunda ise seçici olduğumu düşünüyorum. 9 zirve gibi sanki ama puanlamada 10 da var, hiç bir filme 10 vermemem de çok ilginç bu arada. Çok sevdiğim, döne döne izlediğim filmler var halbuki. Bakalım 9'luk filmler neler.
notion image
Yukarıda benim 9 puan verdiğim filmlerin IMDb puanlarını görüyorsunuz. Caro Diario gibi bir başyapıta insanların neden 7 buçuğun altında benim ise 9 puan vermemi birkaç arkadaşım iyi anlar. Bak yine canım istedi. Listeye tekrar bakıyorum, valla iyi filmler.
notion image
Yukarıdaki filmler de benim 5 ve altında puan verdiğim filmlerin IMDb puanları. Şaşırdığım birkaç tane var acaba niye öyle az puan vermişim dediğim ama en çok The Sixth Sense’e şaşırdım. Hakkındaki sinema çıkışı geyiklerini bilen bilir, spoiler vermeyelim durduk yere.
notion image
Bunlar da krallar. 9 puan verdiğim filmlerin yönetmenleri. Listeyi görünce David Fincher ve Guy Ritchie’ye haksızlık ettiğimi düşündüm. Kendilerinden özür dilerim, onların da burada yer alması gerekirdi. Listeyi güncellerim muhtemelen bunu gördükten sonra, ayıp olmuş. 5 puan ve daha aşağıdaki puanlı filmlerin yönetmenleri için de bir grafik hazırlayıp herkesin önünde onları rencide etmek istemiyorum.
Evet, söyleyeceklerim bu kadar. Anlaşılır olmaya özellikle gayret ettiğim bu kısa ve basit veri analizi hikayesinden ben çok zevk aldım, umarım sizin için de öyledir. Küçük bir listeden bile neler çıkabiliyor işte.
O kadar konuştuk bi David Fincher övmeden ayrılmayalım.
Video preview

🚀 Yazı için hazırladığım kodlara Github hesabımdan ulaşabilirsiniz.
Okuduğunuz için teşekkürler, iyi günler.
 

© Bekir Arslan 2008 - 2024