→ IEEE Standartları → IEEE.org → IEEE Xplore → IEEE Spectrum → IEEE Türkiye
Makine Öğrenmesi(Machine Learning) Nedir?

Günümüzde de sıkça duyduğumuz makine öğrenmesi, 1959 yılında bilgisayar biliminin “Yapay Zekâda Sayısal Öğrenme ve Model Tanıma” çalışmaları sonucu ortaya çıkan bir alt dalıdır. Makine öğrenmesinde algoritmalar yeni verilere dayalı kararlar vermek amacıyla büyük miktardaki verilerin içindeki bazı kalıpları ve özellikleri bulmak üzere eğitilirler. Bu sistem bilgisayarların öğrenmesine yardımcı olmak için doğrudan komutlar yerine matematiksel modelleri kullanılır. Yapılan işlemlerin doğruluğu veri ve deneyim miktarıyla doğru orantılıdır. Ne kadar çok antrenman yaparsa o kadar güçlü olur da denilebilir.

Makine Öğrenmesinin Çalışma Sistemi
Makinenin öğrenme süreci seçtiğimiz bir algoritmaya antrenman verilerini koymamızla başlar. Bu veri bilinen(etiketli) ya da bilinmeyen(etiketsiz) bir veri olabilir. Verinin bilinen ya da bilinmeyen olması seçeceğimiz algoritma tipini etkilemektedir. Verdiğimiz bilgiyi seçtiğimiz algoritma aracılığıyla işleniyor peki işlerin yolunda gidip gitmediğini nasıl anlayacağız? Bunun için bir test kümesi kullanıyoruz. Test kümesindeki verileri girdikten sonra çıkan sonuçları ve tahminleri kontrol ediyoruz. Eğer sonuçlar doğruyu yansıtmıyorsa, en başta da bahsettiğim gibi, bir makine öğrenmesi sistemi ne kadar antrenman yaparsa o kadar güçlüdür yani sistemimiz doğru sonucu bulana kadar tekrar ve tekrar aynı işlemleri uygulamalıyız.
Makine öğrenmesi Türleri
Kaynaktan kaynağa değişmekle birlikte genelde makine öğrenmesinin dört farklı tipi olduğundan bahsedilir bunlar:
Gözetimli Makine Öğrenmesi:
Gözetimli makine öğrenmesi eğitiminde etiketli verileri kullanır. Başka bir deyişle bu öğrenme tipinde kullanılan veriler sistemin yorumlayacağı, karar vereceği bilgiler ile etiketlidir. Gözetimli makine öğrenmesi diğer tiplere nazaran daha az antrenman verisi gerektirir ve öğrenim süreci daha kolaydır. Bu durumun nedeni sistemin çıktılarının kolayca gerçek etiketli veriler ile karşılaştırılabilmesidir. Buna karşın etiketli verileri hazırlaması pahalı olduğundan ve Overfitting* (aşırı öğrenme, aşırı uyma) olma riski bulunmaktadır. Özetlemek gerekirse bu öğrenme tipinde sistemi bilinen doğru sonuçlarla eğitip sonra da bunlar üzerinden tahminler yapmasını istiyoruz.
Gözetimsiz Makine Öğrenmesi:
Gözetimsiz makine öğrenmesinde öğrenim aşamasında etiketsiz verilerden beslenir ve algoritmaları bu veriler arasından etiketlenmesi gereken verileri ayıklamak, onları sıralamak ve sınıflandırmak için kullanır. Bu öğrenme tipinde kararlar ve tahminler daha az otomatikleştirilmekle birlikte daha çok verilerin arasındaki ilişkiyi kurmaya odaklanılır. E-posta sisteminde spam e-postaların belirlenmesi örnek olarak verilebilir.
Yarı-Gözetimli Makine Öğrenmesi:
Adından da anlaşılacağı gibi bu tür gözetimli ve gözetimsiz makine öğrenmesi arasında orta şekerli bir durumdadır. Öğrenme sırasında az miktarda etiketli veriyi oldukça büyük boyutlu etiketsiz verilerin özelliklerini ayıklamak ve onları sınıflandırmak amacıyla kullanır. Yeterli etiketli veri oluşturacak mali gücün olmadığı durumlarda tercih edilebilir.
Destekli(Takviyeli) Makine Öğrenmesi:
Destekli makine öğrenmesi gözetimli öğrenmeye benzeyen davranışsal bir makine öğrenim modelidir ancak algoritma gözetimli öğrenmenin aksine herhangi bir örnek veri kullanmaz. Destekli makine öğrenmesinin temel felsefesi deneme yanılma yoludur. Sistem en mükemmel haline gelene kadar mevcut başarılı sonuçlar sürekli pekiştirilir ve geliştirilir.
Makine Öğrenmesinin Günlük Hayat Uygulamaları
Günümüzde makine öğrenmesinin uygulamaları hemen hemen her yerde kullanılmaktadır bunlardan bazıları:
Dijital asistanlar: Apple Siri, Amazon Alexa, Google Asistan gibi birçok dijital asistan uygulaması kişinin sesini ve yazdıklarını insanlar gibi anlayabilmesini sağlayan bir makine öğrenmesi uygulamasıyla çalışmaktadır.
Öneri bölümleri: Youtube, Spotify, Netflix gibi sitelerin kullanıcıları için içerik önermesi de makine öğrenmesinin eseridir. Kullanıcının izleme alışkanlıkları belirlenir ve buna uygun içerikler önerilir.
Siber Güvenlik: Makine öğrenmesi yardımıyla potansiyel tehditleri belirlemek ve olası bir tehdide müdahale hızını arttırmak adına olay raporları, uyarılar ve hatta blog gönderilerinden bile oldukça fazla istihbarat çıkarılabilir.
*Oversitting: İstatistikte, aşırı uyma, üretilen bir analizin belirli bir veri kümesine aşırı oranda uyum göstermesi, dolayısıyla bu veri kümesinde yer almayan yeni verilere uyum sağlayamaması problemidir.

Erdal Tanırkurt
2021-02-15 550