YÜKLENİYOR...

Category "Veri Görselleştirme"

Grafikler Nasıl Yalan Söyler?

Balon Grafik, Grafik, Harita, Veri Görselleştirme, Yeniden Tasarlama

Son dönemde okuduğum Veri Görselleştirme kitabı, Alberto Cairo’nun yazdığı “How Charts Lie”. Kitabın ilk konusunun çıkış noktası da aşağıdaki tweetti:

Kısaca açıklamak gerekirse, ABD’de son dönemde başkan Trump’ın görevi kötüye kullanmaktan azledilmesi gündemde. Trump destekçisi Lara Lea da, “Bakın ülkenin bu kadar büyük bir kısmının çoğunluk oyunu almış bir insanı azledemezsiniz” minvalinde bir harita paylaştı. (Sanki çok oy alan insan kötü bir şey yapamazmış gibi… Çok oy alan değil, çay veren adam kötü olamaz, İsmail Abi öyle öğretti bize.) Fakat bir diğer sorun ise şu, ilçe bazında verilmiş bu harita da doğru bir veri görselleştirme metodu değil. Alberto Cairo’nun burada kullandığı karşıt argüman çok hoş: “Land doesn’t vote, people do.” yani “Topraklar değil, insanlar oy kullanır.” Dolayısıyla oylamaları toprak üzerinden göstermek doğru değil. Çünkü şu anda çok az gibi gözüken mavi alanlarda çok büyük nüfuslar yaşıyor. Dolayısıyla aslında çizilmesi gereken harita şu:

Bunu okuduktan sonra aklıma tabii ki bizim seçimlerimizde kullanılan haritalar geldi. Son seçim olan Belediyeler seçimleri için hazırlanmış grafiğe bakalım:

http://secim2019.ntv.com.tr/

Siyasi göndermeden bağımsız, bu grafiğin de artık doğru bir gösterim olmadığını rahatça söyleyebiliriz. İlçe bazında olanını da uygun bir zamanda hazırlamaya çalışacağım ama şimdilik il bazında olanını paylaşmak isterim:

Bu grafikleri oluşturmanın birden fazla yolu/uygulaması var. Ben şimdilik Excel’in balon grafiği ile hazırladım ama Tableau ile hazırlayacağım grafikler çok yakında burada…


Date: Oca 20, 2020
AUTHOR: Deniz Aksoy

Verileri Nasıl Sıralamalı?

Alan Grafik, Çizgi Grafik, Çubuk Grafik, Sütun Grafik, Veri Görselleştirme, Yeniden Tasarlama

Geçtiğimiz hafta, Meteoroloji Genel Müdürlüğü’nden (MGM) Erdoğan Bölük, Türkiye’de görülen hava sıcaklıklarıyla ilgili şu tweeti paylaştı:

Grafik bize diyor ki: “Son 20 yıl içerisinde yaşanan bir sıcaklık anomalisi var”. Tam bir açıklama olmasa da, her yılın ortalama sıcaklığının 2000 yılının sıcaklık ortalamasıyla olan farkını görüntülüyoruz. Grafik ne kadar alarm veren bir durumu gösterse de, zaman içerisindeki gelişimi anlayamıyoruz. Tabii hemen kolları sıvadım ve “Ben olsam nasıl yapardım?” sorusunun yanıtı için öncelikle grafiği bire bir kendim oluşturdum:

Grafiğe biraz bakınca düzenlemek isteyeceğim birkaç detay görmüştüm aslında:

  • Hem veri etiketi (data label) hem de Y ekseni etiketi kullanmamak.
  • İçeriğin ön plana çıkmasını sağlayacak beyaz arka planı kullanmak.
  • Grafiğin okunmasında en önemli unsurlardan birisi olan sadeliği korumak için gölge gibi bir görsel efekti kullanmamak.
  • X ekseninde yer alan yılların dikey değil, yatay yazılmasını sağlamak.
  • Başlıkta grafiğin mesajını verip, mevcut başlıktaki bilgilendirmeyi alt başlık olarak yerleştirmek.

Ancak tüm bunların ötesinde bir veri görselleştirme hatası bulunuyor grafikte. Zamansal değerleri anlatan bir grafiğin veri sıralaması, verilerin değerlerine göre değil, zamanına göre yapılmalıdır. Dolayısıyla ilk yaptığım değişiklik bu oldu:

Ancak bu durumda grafikten sıcaklık değerlerinin zaman içerisinde nasıl değiştiğini okuyabiliriz. Mevcut halinden sıcaklıkların ne zaman 2000 yılının değerlerinin altına düştüğünü, öncesinde sonrasında neler olduğunu okumak mümkün değildi.

Buradan itibaren yapılması gereken diğer değişiklikleri uyguladım:

Bu noktada da, acaba bu zamansal değişimi göstermenin doğru yolu alan grafiği midir? Yoksa örneğin çubuk grafik, sütun grafik veya çizgi grafik kullanılabilir miydi?

Çubuk Grafik
Sütun Grafik
Çizgi Grafik

Bu üç grafikten kesin olarak kullanmayacağım bir grafik var, o da çubuk grafik… Çünkü çubuk grafiklerdeki 0’ın sağı/solunda pozitif/negatif değerleri görmek bizim çok alışık olduğumuz bir durum değil. Eğer bir grafikte pozitif ve negatif değerler varsa mutlaka sütun/alan/çizgi grafikten birini seçmeliyiz.

Peki bu 3 grafiğin arasında katı bir doğru var mı? Hayır. Benim seçimim çizgi grafik olurdu ama sütun veya alan seçene de lafım olmaz 🙂


Date: Oca 13, 2020
AUTHOR: Deniz Aksoy

Zamansal Değişim Grafikleri

Çizgi Grafik, Veri Görselleştirme, Yeniden Tasarlama

2 gün önce Ekonomi Profesörü Veysel Ulusoy twitter hesabından şu tweeti paylaştı:

Bu grafiği görünce aklıma hali hazırda paylaşmak istediğim bir yeniden tasarlama geldi. Tam da uygun bir örnek yakalamışken kullanmak istedim.

Şimdi öncelikle grafiğimizi değerlendirerek işe başlayalım. 3 şehre ait 15 yıllık GSMH verilerini görüyoruz ve grafiğin kendisinden alabileceğimiz bir mesaj yok. Sadece bize verileri görüntülemiş. Fakat bu 45 veriyi birbirinin içine geçmişken kıyaslamak kolay değil. Dolayısıyla burada zamansal datanın değişim kıyasını yapabilmenin doğru yolu sütun grafik değil. Grafik Sürekliliği (The Graphic Continuum) infografiğinden yararlandığımızda, zamansal değişimleri gösteren grafikler: Çizgi Grafikler ve Alan Grafikler. Burada kümülatif bir bilgi olmadığından alan grafikleri kullanmak uygun olmayacaktır, dolayısıyla seçimimiz Çizgi Grafik:

Renkler Excel tarafından atanan otomatik palet renkleri. Ancak bu renklerin bir anlamı yok bu grafikte. Peki nasıl renklendirmeliyiz? Hocamızın mesajına bakalım: “Bölgesel gelir farklılığı düalist ekonominin göstergelerini destekler nitelikte…” Demek ki aslında düşük gelirli olan şehirlerimizi vurgulamaya çalışıyoruz ve İstanbul verisi de onların karşısında zıt olarak verdiğimiz ek bilgi. Bu durumda grafiğimizi şu şekilde düzenlememiz gerekiyor:

Tabii bu durumda hangi çizginin Adana, hangisinin Adıyaman olduğunu belirtmek için ya farklı renkler kullanmalıyız ya da bir grafik düzenleme işlemi olarak alt kısımdaki açıklama kısmını (gösterge veya lejan olarak da isimlendirilir) grafiğin içine dahil etmeliyiz.

Eğer çizgilerimizin bir rengi varsa açıklama metinlerini de aynı renkte kullanmak grafiğin okunmasını kolaylaştıracaktır.

Sormamız gereken bir diğer soru da şu: Bu şehirlerin düşük GSMH olduğunu nasıl düşünüyoruz? Neye göre düşük? Evet İstanbul’a göre düşük ama belki de diğer şehirlerden yüksek. Dolayısıyla grafikte yer alması gereken bir diğer bilgi Türkiye Ortalama verisi.

Ancak bu noktada şunu kaçırmamamız gerekiyor: Türkiye verisi bir şehir verisi değil, yani aslında farklı tipte bir veriyi aynı grafikle göstermeye çalışıyoruz. Türkiye verisini farklı bir biçimde göstermek, -farklı bir çizgi tipi veya farklı bir grafikle- verileri ayrıştırmayı kolaylaştıracaktır. Ben alan grafikle göstermeyi tercih ettim:

Evet şimdi grafiğimiz mesajımızı çok daha net bir şekilde göstermeye başladı. Peki ya mesajımız neden burada yok? Hadi onu da ekleyelim:

Son olarak grafik eksenlerini de grafiğin geri kalanının biçimine uygun hale getirip çalışmamızı sonlandırabiliriz:


Nereden Nereye Geldik?


Date: Oca 6, 2020
AUTHOR: Deniz Aksoy

Bu sene yeni şampiyon çıkar mı?

Sıralama Grafiği, Veri Görselleştirme

Madem Süper Lig’de ilk yarı bitti, bu haftanın grafiği de futboldan gelsin. Bump Chart yani Sıralama Grafiği ile, zaman içinde sıralamalarda yaşanan değişiklikleri görselleştirebilirsiniz. Bu grafiği oluşturmak için Excel’i Scatter Plot (Dağılım Grafiği) üzerinden bir miktar kandırmış olabilirim 🙂 Ne dersiniz, bu sene farklı bir şampiyon çıkar mı? ????


Date: Ara 30, 2019
AUTHOR: Deniz Aksoy

İşsizlik oranları yükselişte

Çizgi Grafik, Veri Görselleştirme, Yeniden Tasarlama

Hazırladığınız grafiği bir sunumda kullanacaksanız, grafiğin desteklediği mesajı sunuş sırasında kendiniz söyleyin. Ancak eğer ki grafiği bir raporun içinde gönderecekseniz, grafik kendi kendine konuşmalıdır. Bu durumda da, mesajın grafikten kolayca okunabildiğinden emin olun. Renk kullanımı üzerinden Gestalt’ın benzerlik prensibi ve arkaplan ayrıştırması üzerinden şekil/zemin prensibi algıyı şekillendirecektir.


Date: Ara 23, 2019
AUTHOR: Deniz Aksoy

Farklılığı Görselleştirme

Sütun Grafik, Veri Görselleştirme

Bu hafta Veri Görselleştirme üzerine vermek istediğim örnek bir grafik düzenleme. Twitter’da takip ettiğim bir ekonomist (Mustafa Sönmez) geçtiğimiz hafta aşağıdaki grafiği paylaştı.

İşsizlik oranının 2018 yıllık ve 2019 aylık verilerini içeren bu grafiğin tüm datası aynı değer tipini içerdiğinden, hepsinin sütun ile gösterilmesi güzel; ancak tüm sütunlarının aynı karakterde olması görsel olarak uygun değil. Çünkü okuyucu yıl ve ay verilerini kolayca ayırt edebilmeli. Bunu da Gestalt’ın benzerlik prensibinden yola çıkarak farklı bir renk kullanımı ile sağlayabiliriz. Böylece en sade grafikte bile basit taktiklerle doğru mesajı iletebilirsiniz.


Date: Ara 16, 2019
AUTHOR: Deniz Aksoy

Dinamik Grafikler

Çizgi Grafik, Dinamik Grafik, Veri Görselleştirme

Excel’de hazırlamayı en sevdiğim işlerden birisi dinamik grafikler. Ürün satışlarını grafikleştirirken şunu düşündüm, son ayın verisini bir önceki ayla ve bir önceki yılın aynı ayıyla kıyaslamak isterim. 10 farklı ürünüm var, hepsini beraber karmaşa içinde göstermektense, seçtiğim ürünün grafiğinin o anda karşımda hazırlanmasını tercih ederim. Bir yandan bilgi olarak hepsinin özet verisi de yanda yer alsın tabii… Değişen grafik başlığı, grafik içi metinler, metin renkleri de işin makyaj kısımları… Siz dashboardda başka neyi görmek istersiniz?


Date: Ara 9, 2019
AUTHOR: Deniz Aksoy

Grafiği Doğru Okutma

Dağılım Grafiği, Veri Görselleştirme

Bu haftanın grafiği de müşteriler üzerine. Dağılım grafiklerinde olumlu sonuçların genellikle sağ üst köşede yer almasına alışığız. Ancak eğer grafikteki parametrelerden en az birisi CHURN Rate yani Kaybedilen Müşteri Oranı gibi olumsuz bir değeri içeriyorsa, o zaman grafiği okuyanları uyarmalıyız. Bunun da en kolay yolu, ekteki CHURN vs. Retention Rate (Sadık Müşteri Oranı) grafiğinde olduğu şekilde arka planda olumlu ve olumsuz alanları boyayarak işaretlemek olacaktır. Bu ve benzeri tüm grafik okuma ipuçları ve taktikleri yakında başlayacak “Yöneticiler için Grafik Okuryazarlığı” eğitimimde…


Date: Ara 6, 2019
AUTHOR: Deniz Aksoy