PROF. DR. FİKRİ AKDENİZ - BİLİM DÜNYASI


BİLİM VE VERİ BİLİMİNE STATİSTİKSEL BAKIŞ AÇISI


Bilim: Fiziksel ve doğal dünyanın yapısı ve davranışının gözlem ve deney yoluyla sistematik olarak incelenmesini kapsayan bir etkinliktir. Modern bilim tipik olarak doğayı en geniş anlamda inceleyen doğa bilimlerinden (örneğin biyoloji, kimya ve fizik) oluşan üç ana dala ayrılır; bireyleri ve toplumları inceleyen sosyal bilimler (örneğin, ekonomi, psikoloji ve sosyoloji); ve kurallarla yönetilen simgelerle ilgilenen formel (biçimsel) bilimler (örneğin, mantık, matematik ve teorik bilgisayar bilimi) dir. Mühendislik ve tıp gibi pratik amaçlar için mevcut bilimsel bilgiyi kullanan disiplinler, uygulamalı bilimler olarak tanımlanır. Ünlü gökbilimci Carl Sagan (1934-1996) ın deyimiyle ““Bilim, bir bilgi birikiminden çok bir düşünme biçimidir”

 Yapılandırılmış veri: Genel bir bağlamda yapılandırılmış veri terimi, bir şekilde düzenlenen herhangi bir veri veya bilgiyi ifade eder. Bu tanım, ilişkisel veri tabanlarında ve elektronik tablolarda bulunan verileri içerir. Yapılandırılmamış veriİşletme enformatiği ve bilgisayarlı dilbilim gibi alanlarda dijital olarak erişilebilir durumda olan ancak önceden tanımlanmış bir veri modeline sahip olmayan veya önceden tanımlanmış bir şekilde düzenlenmemiş verilere verilen isimdir.

Veri Bilimi: Yapılandırılmış ve yapılandırılmamış verilerden bilgi ve öngörüler çıkarmak için bilimsel yöntemler, süreçler, algoritmalar ve sistemleri kullanan ve verilerden elde edilen bilgileri ve eyleme dönüştürülebilir öngörüleri çok çeşitli uygulama alanlarında uygulayan disiplinler arası bir alandır.  Veri bilimi, veri madenciliği, makine öğrenimi ve büyük veri ile ilgilidir. Veri bilimi, verilerle "gerçek olayları anlamak ve analiz etmek" için "istatistik, veri analizi, bilişim ve bunlarla ilgili yöntemleri birleştirmeye yönelik bir kavramdır.  Matematik, istatistik, bilgisayar bilimi ve bilgi bilimi bağlamında birçok alandan alınan teknikleri ve teorileri kullanır. Ancak veri bilimi, bilgisayar bilimi ve bilgi biliminden farklıdır. (Wikipedia)

Veri bilimi, büyük miktarda veriyi yararlı tahminlere ve öngörülere dönüştürme sözü vererek büyük ilgi gördü. Bu yazıda bilim insanlarının veri bilimine neden önem vermesi gerektiğini soruyoruz. Yanıtlamak için veri bilimini istatistiksel perspektifle (bakış açısıyla) inceleyeceğiz.

 “Veri bilimi” terimi son yıllarda çok dikkat çekti. Bu ilginin çoğu işletme, akademik istatistik ve bilgisayar bilimi alanlarındadır. Bilim insanları veri bilimini neden umursayabilir?

Bizim bakış açımız, veri biliminin istatistik ve bilgisayar biliminin çocuğu olduğu yönündedir. Veri bilimi bunların bazı yöntemlerini ve düşüncesini miras almış olsa da, bunları harmanlamayı, yeniden odaklamayı ve modern bilimsel veri analizinin bağlamını ve gereksinimlerini ele alacak biçimde geliştirmeyi de amaçlamaktadır. Modern araştırmalarda, farklı disiplinlerden bilim insanları, bol miktarda veri kümesi ile karşı karşıya kalıyorlar. Sosyal bilimciler artık, genellikle insan davranışı ve etkileşimleri hakkında zengin bilgiler içeren, sayısallaştırılmış metinlerin büyük arşivlerini inceleme fırsatına sahipler. Modern teleskoplar, gözlemsel astronomiyi dönüştüren ve milyarlarca gökyüzü nesnesi hakkında yüzlerce terabaytlık ham görüntü verisi üreten dijital gökyüzü araştırmaları yaratır.

Bu örnekler modern bilimlerde nelerin olabileceğinin bir resmini çiziyor. Bununla birlikte, tüm bilim dallarını olmasa da pek çok bilim dalını ilgilendiren bir konu, bilim insanlarının yeni verilerinden henüz tam olarak yararlanamamasıdır. Özellikle sosyal bilimcilerin önceliklerini yansıtan büyük belge koleksiyonlarında gezinmek için araçlar oluşturmak, klasik belge analizi yöntemleriyle çözülmeyen bir sorundur. Evrenin karmaşık doğasını anlamak için dijital gökyüzü araştırmalarını kullanmak, daha önceki dönemlerin manuel olarak yöneticiliğinde yapılan çalışmalarda kullanılanların ötesinde hesaplama araçları ve istatistiksel varsayımlar gerektirir.

İstatistiksel Perspektif (Bakış açısı)

İstatistiksel düşünme, bilimsel soruları verilerle yanıtlama yöntemleri sağlar. Veri bilimi hakkındaki tartışmalar genellikle veri ve hesaplamanın büyük ölçekli yönlerine odaklanır. Bu konular önemlidir, ancak bu odaklanma, veri biliminin temel hedeflerinin istatistiksel düşünmeye dayandığını gözden kaçırır. Başlangıcından bu yana istatistik, veri toplama ve analizine rehberlik etmek için bilime hizmet etti. Bilim ve veri arasındaki ilişkinin birçok yönü (veri analizini kullandığımız alanlar, verilerin ölçeği ve bilimsel soruların doğası) değişmiş olsa da, temel ilkeler aynıdır.

Genel olarak istatistik, verileri anlamlandırmak için yöntemler geliştirmekle ilgilidir. Alan geliştikçe, bu yöntemler büyük ölçüde matematik ve olasılık dillerinde kullanılmıştır. İstatistikler, gerçek dünyadaki değişkenler ve varlıklar arasındaki ilişkileri modellemek için çeşitli işlevsel ve dağılımsal varsayımları kullanır ve bu tür ilişkiler hakkında çıkarımlar ve tahminler yapmak için gözlemlenen verileri kullanır.

Tüm veri kümeleri belirsizlik içerir. Bunların nasıl toplandığı, nasıl ölçüldüğü veya onları oluşturan süreç hakkında belirsizlik olabilir. İstatistiksel modelleme, belirsizlikleri sistematik bir şekilde ölçmeye ve bunlar hakkında akıl yürütmeye yardımcı olur. Belirli problemler ve gerçek veriler için çıkarımlara ve tahminlere rehberlik eden araçlar ve teori sağlar. İstatistik, birden fazla istatistiksel alt alan aracılığıyla veri bilimi ile ilgilidir. Burada üç tanesini inceleyeceğiz: karmaşık ve yapılandırılmış veriler, yüksek boyutluluk ve nedensellik.

Modern veri kümeleri karmaşıktır. Örneğin, iklim verilerini içeren bir araştırma problemini düşünün. Verilerde farklı türde bağımlılıklar olabilir: zamana bağlı bağımlılıklar, çoklu uzamsal ölçeklerdeki bağımlılıklar ve yağış, basınç ve sıcaklık gibi farklı değişkenler arasındaki bağımlılıklar. İstatistik, bu tür bağımlılıkları modellemek için zengin bir dil sağlar.

İstatistiğin ilgili bir alt alanı, veri noktası başına binlerce hatta milyonlarca değişkeni ölçtüğümüz yüksek boyutlu verilerle ilgilidir. Bilimsel ölçüm giderek daha karmaşık hale geldikçe, yüksek boyutlu verilerden istatistiksel çıkarımlar birçok bilimsel disiplin için daha önemli hale geldi. Bu tür verileri işlemek için istatistikçiler ve bilgisayar bilimcileri sağlamlık, düzenlilik ve kararlılık içeren güçlü yöntemler geliştirdiler Derin öğrenme gibi makine öğrenimi teknikleri bu bağlamda özellikle etkili olmuştur.

Sonuç olarak, bu yazımızda Uygulama, araştırma ve eğitim için çıkarımları olan bir veri bilimine istatistiksel bir bakış açısı sunduk. Ayrıca, gerçek dünya sorunlarını çözmek için bir veri bilimci geleneksel eğitimlerinin ötesinde görevleri üstlenmesi gerekeceğine odaklanmaktadır. Veri bilimi, istatistik ve bilgisayar biliminin birleşiminden daha fazlasıdır - istatistiksel tekniklerinin daha geniş bir çerçeveye, problemden probleme nasıl örüleceği ve disipline özgü soruların nasıl ele alınacağı konusunda eğitim gerektirir. Bütünsel veri bilimi, verilerin bağlamını anlamamızı, özel ve genel verilerin kullanılmasıyla ilgili sorumlulukları takdir etmemizi ve bir veri kümesinin bize dünya hakkında neler söyleyip neyi söyleyemeyeceğini açıkça iletmemizi gerektirir.

Dostça kalın!...

 

YAZARLAR

  • Cumartesi 31 ° / 16.7 ° false
  • Pazar 35.8 ° / 19.6 ° Bölgesel düzensiz yağmur yağışlı
  • Pazartesi 30.8 ° / 18.3 ° Bölgesel düzensiz yağmur yağışlı
  • BIST 100

    9809,64%0,96
  • DOLAR

    32,58% 0,30
  • EURO

    35,07% 0,29
  • GRAM ALTIN

    2457,40% 0,88
  • Ç. ALTIN

    3991,84% 0,00