Bizi takip edin

Güvenlik Önerileri

Türleri ve İçerikleri ile Siber Dolandırıcılık Önleme Modelleri

Dolandırıcılık, geniş bir alana yayılan kapsayıcı bir terim…

tarihinde yayımlandı

Dünya giderek daha dijital hale geldikçe insanlar da daha iyi teknoloji ve araçlar ile kendilerini donatıyor. Büyük veri, bulut bilişim, modern tahmin algoritmaları gibi gelişmiş teknolojiler şirketlere dolandırıcılık olaylarını hiç olmadığı kadar iyi takip etme imkânı veriyor. Öte yandan dolandırıcılık eylemleri yine de rekor seviyelerde. PwC tarafından sunulan verilere göre, sadece ABD’de Ağustos 2019-Ağustos 2021 arasındaki dönemde tüm şirketlerin %47’si dolandırıcılık girişimine maruz kaldı ve toplamda 42 milyar dolarlık zarar oluştu. Bu makalede tahmin algoritmalarını öne çıkararak dolandırıcılık modellerine, bir dolandırıcılık modelinde kullanılan içeriklere ve modelin nasıl gerçekleştirildiğine göz attık.

Dolandırıcılık tahmin modellerinin türleri 

Dolandırıcılık, geniş alana yayılan kapsayıcı bir terim. Bu sebeple her biri kendi amacına hizmet eden çeşitli dolandırıcılık modelleri inşa edebilmek şaşırtıcı değil. En çok rastlanan dolandırıcılık modelleri ise şu şekilde:

1- Profil spesifik modeller finansal işlem spesifik modellerine karşı!

“Masum olduğu kanıtlanana kadar suçlu” fikri, sadece mahkeme salonlarında geçerli bir adalet şekli değil. Bu felsefe kullanıcılarınız için de geçerli ve başkalarının dolandırıcılık eylemleri nedeniyle dijital hapishaneye götürülmemeleri için aşağıdaki iki modeli ayırt etmeniz gerekiyor:

a-Profil spesifik modeller: Kullanıcı seviyesinde dolandırıcılık eylemini saptayama odaklanır. Kısaca, bir kullanıcının dolandırıcı olup olmadığını anlamaya yarar.

b-Finansal işlem spesifik modeller: Daha tanecikli bir yaklaşım ile dolandırıcılık içeren finansal işlemleri saptamaya yarar.

İlk bakışta her iki model de aynı amaca hizmet ediyor görünebilir, ancak her zaman dolandırıcılık içeren her işlem bir dolandırıcıyla bağlantılı değildir. Bir kişi banka kartının çalınmasının ardından yasa dışı bir işlem gerçekleştirilmesi nedeniyle dolandırıcılık yapmış olmaz. Aynı zamanda bir dolandırıcının yaptığı işlemlerin tamamı dolandırıcılık içerecek diye bir gaye de söz konusu değil (dolandırıcılık yapan bir kişinin finansal işlem yapmasına izin verilip verilmemesi konusuna değineceğiz).

2- Kural tabanlı modeller makine öğrenimi modellerine karşı!

a- Kural tabanlı modeller: Sıkı bir şekilde hazırlanmış, “eğer” veya “olay-mekan” odaklı açıklamalara dayanır. Kural odaklı modeller ile siz kendiniz için geçerli kurallar ile çıkagelmelisiniz. Kural odaklı modeller dolandırıcılık kokan faaliyetlere işaret eden eylemleri çok iyi tanıyorsanız kullanışlıdır. Ancak bu modeller eğer tüm dolandırıcılık bağlantılı sinyalleri saptayamıyorsanız ya da bu sinyallerin sadece dolandırıcılık bağlantılı eylemler ile bağlantılı olduğunu doğrulayamıyorsanız, çeşitli ölçülerde zorluklar çıkarabilir.

Örneğin, bankaların kredi kartınızı nerede kullandığınızı esas alan kural odaklı modelleri vardır. Eğer kredi kartınızı kullandığınız yer ile ev adresiniz arasındaki mesafe belli bir limitin üzerine çıkarsa (eğer evinizden çok uzak iseniz), finansal işlem otomatik olarak reddedilebilir.

b- Makine öğrenimi odaklı dolandırıcılık modelleri: Geride kalan on yıl içinde veri bilimi giderek daha popüler hale geldi. Makine öğrenimi, eğer dolandırıcılık kokan sinyalleri yakalayamıyorsanız size yardım edecektir. Bu modelde makine öğrenimine bir dizi içerik (değişken) sunuyorsunuz ve model sinyali kendisi tespit ediyor.

Bankalar hangi eylemlerin dolandırıcılık içerdiğini anlamak ve soruşturulmaları adına ikinci safhaya aktarılmalarını sağlamak adına çok sayıda mühendis çalıştırmaya başladı. Bu şekilde, makine öğrenimi zamanla hangi eylemlerin diğerlerine nazaran daha fazla dolandırıcılık işareti içerdiğini öğrenebiliyor.

Teknik okuma:
Modellerde kullanılması gereken ana içerikler 

Dolandırıcılık tahmin modelinizin içeriklerini belirlerken, dolandırıcılığı tespit eden olabildiğince fazla sinyali tespit etmeye çalışmalısınız. Makine öğreniminde bu amaçla sıkça kullanılan temel içerikler şu şekilde belirir:

-Kayıt yaptırma veya finansal işlem zamanı: Kayıt yaptırılan ve işlemlerin gerçekleştirildiği zamanlar iyi birer sinyaldir, çünkü kullanıcıların normal çalışma saatleri hakkında fikir sunar. Belli zaman dilimleri dışında gerçekleştirilen işlemler dolandırıcılık şüphesi uyandırır. Bu da insanların genelde finansal işlem gerçekleştirmediği zamanlarda bir dizi işlemin yapılabileceği anlamına gelir.

-İşlemin konumu: İşlemin yapıldığı konum, bazen dolandırıcılığın sinyalini verebilir. Eğer bulunduğunuz yerden gerçekleştirilen bir işlemin sadece birkaç dakika sonrasında 3 bin 500 km ötede bir işlem daha uygulanırsa, muhtemelen bu dolandırıcılığa işaret etmektedir.

-Ortalama harcama oranı maliyeti: Bu sinyal, kullanıcının ortalama işlem maliyeti ile gerçekleştirilen işlemin ücretini karşılaştırır. Oran yükseldikçe, finansal işlemin de normal olmama olasılığı yükselir.

-E-posta bilgileri: Bir e-posta hesabının ne zaman oluşturulduğu, şüpheli davranışın tespit edilmesini sağlayabilir (örneğin birisi dolandırıcılık amaçlı bir e-posta alırsa ve gönderen kişi hesabı henüz dün oluşturmuş ise bu durum dolandırıcılık şüphesi uyandırır).

Ne kadar çok sinyal sunabilirseniz ve bunlar ne kadar güçlü olursa modeliniz, dolandırıcılık eylemlerini o kadar başarılı tespit edebilir.

Bir dolandırıcılık modeli nasıl değerlendirilir? 

Bir dolandırıcılık modelini normal makine öğrenimi modellerinden farklı değerlendirmek zorundasınız. Sebebi, dolandırıcılık faaliyetinin modellerinizi eğitmek için kullandığınız genel verilerin sadece çok küçük bir kısmını temsil etmesidir.

Neden hesap doğruluğu kullanmamalısınız? 

Dolandırıcılık tespiti “dengesiz sınıflandırma problemi” olarak belirlenmiştir. Spesifik olarak, dolandırıcılık profilleri ve işlemleri ile dolandırıcılık içermeyen profiller ve işlemler arasında belirgin bir dengesizlik söz konusudur. Bu sebeple, hesaplama doğruluğunu bir değerlendirme ölçeği olarak kullanmak tek başına yeterli olmaz.

Bir örnek vermek gerekirse, içinde bir dolandırıcılık ile 99 normal işlem yer alan bir veri dizini düşünün (gerçek dünyada bu oran daha da küçüktür). Eğer bir makine öğrenimi modeli her bir işlemi dolandırıcılık olarak sınıflandırırsa, bu %99 doğruluk demektir! Maalesef bizler normal işlemlerden endişe duymadığımız için hesap doğrulaması modeli sorunu çözümlemek için yeterli olmayacaktır.

Hesap doğrulama yerine kullanılması gereken ölçekler

Bir dolandırıcılık tahmin modelini değerlendirmek için kullanabileceğiniz iki ölçek şu şekilde:

1-Kesinlik: Pozitif tahmin değeri olarak da bilinen kesinlik, yeniden yaşanmış durumlardaki bağlantılı olayların oranını temsil eder. Kısaca, sizin için “Pozitif kimlik tanımlamalarının kaç tanesi doğruydu?” sorusunu cevaplar.

Normal bir işlemi dolandırıcılık olarak sınıflandırmak çok pahalı olduğunda ve dolandırıcılık işlemlerinin sadece bir kısmını tespit etmek sizin için yeterli ise kesinliği kullanabilirsiniz.

2-Hatırlama: Hassaslık, darbe oranı veya doğru pozitif oran (TPR) olarak da bilinen hatırlama, geri tanımlamalarda bağlantılı olayların toplam sayısını içeren orandır. Sizin için “Gerçek pozitiflerin kaç tanesi doğru olarak tanımlandı” sorusunu cevaplar.

Her bir dolandırıcılık eylemini tanımlamanız sizin için kritik önem taşıdığında ve bazı normal işlemleri dolandırıcılık olarak tanımlamanız önemli değilse, hatırlamayı kullanabilirsiniz.

Her bir ölçeğin kendine özgü avantajları ve dezavantajları bulunmaktadır. Karşınızdaki iş bağlantılı soruna göre her ikisinin güçlü ve zayıf taraflarını değerlendirmeniz gerekir.

Bilginizi bir adım öteye taşıyın 

Dolandırıcılık modelleri, modeller içinde kullanacağınız içerikler ve dolandırıcılık modelinizi nasıl değerlendireceğinizi bilmeniz oldukça önemlidir.

Bu aşamada dolandırıcılık, e-ticaret ve veri bilimi hakkında daha fazla bilgi edinebilir ve Python ile bir dolandırıcılık tahmin modelinin nasıl hazırlandığını görmek adına örneklere bakabilirsiniz.

Okumaya Devam Et