Makale

Bir Web Sayfasını İçerik İçin “Kazımak” Yasal mı?

“Web scraping” olarak adlandırılan yöntem, botlar kullanarak bir sayfasından veri toplaması anlamına geliyor. Son yıllarda iş istihbaratı ve veri gizliliği üzerindeki tartışmaların artması, web scraping ile alakalı görüşlerin de mercek altına alınmasına yol açtı.

Bilgi Güvende

tarafından

14 Kasım 2022

tarihinde yayımlandı

Web scraping yöntemi, web sayfaları belirmeye başladığı zamandan bu yana kullanılan bir yöntem. Aslına bakılırsa, internetin temelden desteklenmesini sağlayan bir “iyi web scraping” söz konusu. Bu yöntemin iyi uygulanması halinde ortaya çıkan avantajlar şu şekilde:

– “İyi” araştırma motoru botları web sayfalarını içeriklerine göre indekslemek, analiz etmek ve sıralamak için kullanıyor,

– Fiyat karşılaştırma amacı ile e-ticaret ve her türlü ürünün satıldığı platformlardan bilgi toplayan botlar, tüketicilerin kolayca karşılaştırma yapabilmesini sağlıyor,

– Piyasa araştırma şirketleri forumlar ve sosyal medyadan çektikleri veriler ile kamu yaklaşımının ölçüldüğü araştırmaları destekliyor (trend konular ve ürünler gibi).

Öte yandan, yukarıdaki maddeler iyi amaçlı scraping işleminin sona erdiği aşamayı temsil ediyor. 2022 Bad Bot raporuna göre kötü amaçlı botlar tüm web, mobil ve uygulama programlama arayüzleri (APIs) üzerinde %27.7 gibi bir orana sahip. Bu, geçtiğimiz yıla kıyasla oranın %2.1 arttığına da işaret ediyor. Kötü amaçlı botlar olarak adlandırılmalarının sebebi ise web sayfalarından toplanan verilerin, söz konusu sayfaların kontrolü ve istekleri dışında kullanılmasına neden olmaları.

Web scraping’in yanı sıra, siber suçlular kötü botları DDoS, rekabetçi veri madenciliği, çevrimiçi dolandırıcılık, hesap çalma, veri hırsızlığı, fikri mülk hırsızlığı, izinsiz hassasiyet taramaları, spam ve dijital reklam dolandırıcılığı gibi çeşitki eylemler için kullanıyor.

Kötü niyetli internet aktörlerinin web scraping’i en çok kullandığı amaçlar haksız rekabet elde etmek için fiyatlar ile oynamak ve telif haklı içerik ile fikri mülkiyet hırsızlığı olarak beliriyor. Geride kalan soru ise bunun yasal olup olmadığı.

LinkedIn ve hiQ Labs dosyası

LinkedIn, 2017 yazında San Francisco merkezli startup hiQ Labs aleyhinde dava açtı. hiQ, LinkedIn’de kamuya açık bilgileri toplayarak müşterilerine sunuyordu. Açıklamaları, “Aylar öncesinden yetenek açıklarını ve mali dönem risklerini tespit etmenizi sağlayacak bir kristal küre sunmak” olarak beliriyordu.

İşvereniniz tarafından kamuya açık LinkedIn profilinizin sizin aleyhinize kullanılması fazlasıyla rahatsız edici. Diğer yandan, 14 Ağustos 2017’de mahkeme bunun bir sorun teşkil etmediğine hükmetti. San Francisco Bölge Mahkemesi’nden Yargıç Edward Chen, hiQ’nun itirazını kabul etti: Microsoft sahipliğindeki LinkedIn, kamuya açık verilere erişimi engelleyerek antitröst kanunlarını ihlal ediyordu. Yargıç Chen, LinkedIn’in 24 saat içinde bariyerleri kaldırmasını emretti. LinkedIn ise temyize gitmeye karar verdi.

Mahkemeden çıkan karar, web scraping ile bağlantılı geçmişteki kararlara ters düşüyordu. Aynı zamanda sosyal medya kullanıcı gizliliği ve kurumların kendilerini veri hırsızlığına karşı koruyabilmeleri hakkında çok sayıda soru işaretini beraberinde getirdi. Aynı zamanda adil kullanım ile bağlantılı soru işaretleri de söz konusu…

LinkedIn gerçek bir değeri olan içerik oluşturmak için yıllar harcadı. Peki neden LinkedIn insan kullanıcılarını ikinci plana atarak botlar ile veri toplamak için yatırımını genişbant ve sunuculara harcayan bir şirkete verilerini teslim etmek zorunda? Sırf hiQ LinkedIn’in ceket sırasını kontrol edebileceği için mi?

LinkedIn ile hiQ arasındaki yasal mücadelede henüz en son söz söylenmiş değil. hiQ kendisini “kamu veri kaynakları ile beslenenen, insan sermayesine uyarlanmış bir veri bilimi şirketi” olarak lanse ediyor.

LinkedIn, hiQ’nun kamuya açık iş profillerinden veri toplamasını engellemeye çalışıyor. Bölge Mahkemesi’nden çıkan ve web scraping’in yasal olduğunu savunan kararın ardından temyiz dosyasını Mart 2020’de Yüksek Mahkeme’ye iletti. Umdukları yönde, Yüksek Mahkeme hiQ’yu durdurabilmesi için LinkedIn’e bir kapı araladı. Yine de mahkeme, dosyayı üstlenmeyeceğini belirtti. Bunun yerine Temyiz Mahkemesi’nin dosyayı tekrar incelemesini talep etti. Mahkeme, bir kişinin kullanma izni bulunan bilgisayar aracılığı ile veriye uygunsuz şekilde erişim sağlamasının Bilgisayar Dolandırıcılığı ve Kötüye Kullanma Yasası (CFAA) ihlali olduğunu kaydetti.

Süren dava LinkedIn’in mücadele ettiği tek yasal savaş değil. Şubat 2022’de, LinkedIin Singapur merkezli veri kazıma taraflarını temsil eden Mantheos Pte. Ltd., Jeremiah Tang, Yuxi Chew ve Stan Kosyakov aleyhine de dava açtı. LinkedIn bu şirket ve kişilerin data scraping ile yasa dışı gelir sağladığını ve kullanıcı şartlarını ihlal ettiklerini öne sürdü. Dava devam ediyor.

Web scraping üzerindeki karar ne?

Web sayfalarının verilerini korumak için başlattıkları mücadeleyi sürdürdüğü günlerde, web scraping üzerindeki tartışmaların henüz geçmediği aşikâr. Mahkemelerin bu yöntemin yasallığı üzerinde değerlendirmek yaptıkları süreçte, verileriniz çalınabilir ve web sayfanızın iş mantığı bozulabilir. Söz konusu teknoloji mücadelesinin yasal geri ödemelerini beklemek yerine, bu yöntemin gelişmiş bot koruması ve anti-scraping teknolojileri ile önlenmesi mümkün.