Yapay Veri Kümesi
Yapay Veri Kümesi
İki sarmal sınıflandırma, örüntü tanımadaki klasik problemlerden biridir. İki sarmal fonksiyon örneklerinin dağılımları şekil 1’de gösterilmiştir.
t parametresinin değerleri 0,02 ila 10 arasındadır ve adım 0,02’dir. Her sınıfta beş yüz örnek var. Birinci sınıf pozitif örnek seti olarak gösterilir ve ikincisi negatiftir.
Deneylerin amacı, dengesiz veri setli sınıflandırma problemlerinde SVDD modelinin SVM modeline göre öğrenme ve öngörme doğruluğunun gelişimini göstermektir. Farklı sayıda örneklem kullanılarak öğrenme ve tahmin etme deneyleri gerçekleştirilir.
Birkaç farklı sayıda pozitif ve negatif örnekle her iki modeli kullanarak iki sarmal fonksiyonun bir grup öğrenme ve tahmini sonuçlarını göstermektedir. Bu deney grubu aşağıdaki gibi tasarlanmıştır.
n+ ve n−, pozitif ve negatif örneklerin sayısını belirtir. Öğrenme sürecinde, tablo 1’de gösterilen yapay iki sarmallı veri setinden rastgele n+ pozitif ve n- negatif örneklem seçilir. Karşılaştırma deneylerinin her grubunda her iki modelde de aynı öğrenme örnekleri kullanılmıştır. Tahmin işleminde, yapay veri setinin kalan kısımları tahmin edilecek numuneler gibidir.
Birinci tabloda, (n+ , n− ) öğrenme örneklerinin sayısını, ARL öğrenmenin doğruluk oranını ve ARP tahminin doğruluk oranını gösterir. Öğrenmenin doğruluk oranı, doğru sınıflandırılan örneklerin toplam öğrenme örneklerine oranıdır.
Tahminin doğruluk oranı, doğru sınıflandırılmış örneklerin toplam tahmin edilen örneklere oranıdır. Tüm deneyler aşağıdaki koşullar altında gerçekleştirilir: donanım CPU Pentium4 2.4 GHZ, RAM 512MB; yazılım Windows XP ve Matlab7.0.
Tablo 1’de gösterilen deneysel sonuçlardan, pozitif örnek sayısı negatif örnek sayısına eşit olduğunda, WLS-SVM modelinin SVDD modelinden biraz daha yüksek öğrenme ve tahmin doğruluğuna sahip olduğunu görebiliriz.
Ancak, pozitif örnek sayısı negatif örnek sayısından büyük ölçüde farklı olduğunda, SVDD modeli görünüşe göre WLS-SVM modeline kıyasla daha yüksek öğrenme ve tahmin doğruluğunu koruyor. Bu nedenle SVDD modeli, dengesiz yapay veri setiyle sınıflandırma problemlerinin üstesinden gelmede daha etkilidir.
Veri seti örnekleri
Hazır veri setleri
Makine öğrenmesi veri seti oluşturma
Excel hazır veri seti indir
Yapay Zeka veri seti
İstatistik veri seti
COVID-19 veri Setleri
Derin Öğrenme veri seti
Kıyaslama Veri Kümesi
Bu alt bölümde, deney örnekleri UCI üniversitesi bilgisayar enstitüsünün açılış veri tabanından seçilmektedir. Veritabanında Avustralya, Almanya ve Japonya ile ilgili bankaların üç set bireysel kredi notu bulunmaktadır.
Avustralya ile ilgili veri tabanı kullanılarak yapılan deneysel sonuçlar aşağıda listelenmiştir. Veritabanında toplam 690 örnek bulunmaktadır. Pozitif örnek sayısı (iyi kredi) 307’dir ve diğerleri negatif örnektir. Örnek oluşturmak için on dört değerlendirme indeksi ve bir kredi değeri vardır.
Veritabanı öncelikle ön işleme tabi tutulur. Veritabanındaki tüm kayıtlar sayısal olarak imha edilmiştir. Buna göre endeks ve kredi değeri sayısal değerlerle ifade edilir. Her örneği gösteren giriş vektörünün, her örneğin kredi indeksinden on dört boyutlu bir vektör olduğunu görebiliriz.
İki vektörün iç çarpımı, her iki vektörün her bir bileşenine göredir. Ancak orijinal veritabanındaki her indeksin değer aralıklarında muhteşem bir ayrım vardır.
Girdi vektörünün (her bir kredi indeksi) her bir bileşeninin etkisini dengelemek için, indeksin tüm değerleri, maxxj ve minxj’nin veri tabanındaki tüm numunelerin j’inci indeksinin maksimum ve minimum değerlerini gösterdiği şekilde kullanılarak normalleştirilir. ve j = 1, 2,…,14 , ben = 1, 2,…, 690 . Böylece normalize edilmiş verilere ulaşılır.
Ağırlıklı LS-SVM modelini ve farklı sayıda pozitif ve negatif örneklem içeren SVDD modelini kullanan Avustralya veri setini kullanan bankaların bireysel kredi puanlamasının bir grup öğrenme ve öngörme sonuçlarını göstermektedir.
Çekirdek işlevi ve parametreleri, yapay veri kümesindeki deneylerle aynıdır. Tablo 2’de, n+ ve n−, pozitif ve negatif örneklerin sayısını belirtir. Öğrenme sürecinde, Avustralya ile ilgili veri tabanından rastgele n+ pozitif ve n- negatif öğrenme örneği seçilir.
Karşılaştırma deneylerinin her grubunda her iki modelde de aynı öğrenme örnekleri kullanılmıştır. Tahmin işleminde, veri setinin kalan kısımları tahmin edilecek numuneler gibidir. Deney ortamları, yapay veri kümesindekilerle aynıdır.
Tablo 2’den, pozitif örnek sayısı negatif örnek sayısına eşit olduğunda, SVDD modelinin ve WLS-SVM modelinin benzer öğrenme doğruluğuna sahip olduğunu görebiliriz.
Pozitif örneklerin sayısı negatif olanların sayısından farklı olduğunda SVDD modeli, yapay veri kümesindeki deneysel sonuçlara büyük ölçüde benzer olduğunda, WLS-SVM modellerine kıyasla daha yüksek öğrenme ve tahmin doğruluğuna sahiptir.
Avustralya’nın bireysel kredi puanlama veri setini kullanarak öğrenme ve tahmin etme doğruluklarının, iki sarmalın yapay veri setininkiler kadar iyi olmadığını görüyoruz. Bunun bir nedeni, bireysel kredi puanlama veri setinin kendisinin kesin olarak ayrılamaz olmasıdır.
Bu makalede, dengesiz veri setine sahip SVDD sınıflandırma modeline dayalı yeni müşteri kredi puanlama tahmini yöntemi önerilmiştir. Öncelikle ana tahmin yöntemleri gözden geçirildi. Daha sonra dengesiz veri seti için SVDD sınıflandırma modeli analiz edildi.
Ve modelin parametrelerini çözmek için çarpımsal güncelleme ilkesi tartışılmıştır. Ardından, SVDD modeline dayalı olarak bankaların müşteri kredi skorlaması için yeni bir öğrenme ve tahmin yöntemi önerilmiştir.
Son olarak, önerilen yöntem ve WLS-SVM tabanlı yöntem kullanılarak sentezlenen iki sarmal veri seti ve bankaların bireysel kredilerinin kıyaslama veri seti üzerinde deneyler yapılmıştır.
Eşler Arası hizmet ağı, internet teknolojisinde önemli bir rol oynamaktadır. Yönlendirme mekanizması, P2P hizmet ağı için temel teknolojidir. Bu yazıda, yapılandırılmış P2P hizmet ağı için K-BRiR adlı verimli ve kendi kendini organize eden bir yönlendirme mekanizması sunulmaktadır. K-BRiR, halka topolojisine dayanan temel bir yönlendirme protokolü BRiR içerir. Tanımlar ve algoritmalar tartışılmıştır. Deneysel sonuçlarımız, K-BRiR’nin P2P hizmet ağında kararlı ve verimli olduğunu doğrulamaktadır.
Deneysel sonuçlar, önerilen yöntemin, bankaların müşteri kredi notlarının tahmin edilmesi gibi dengesiz veri setli sınıflandırma problemlerinde WLS-SVM tabanlı yöntemden daha etkili olduğunu göstermiştir. Aynı deney koşulları altında SVDD modelinin öğrenme ve tahmin doğrulukları LS-SVM modelinden daha yüksektir.