14 Haziran 2026

Atıf Ağlarından Makale Önerisine: Çok Katmanlı Graf Tabanlı Bir Yaklaşım

#graf-teorisi#ağ-bilimi#öneri-sistemleri#openalex#akademik

Her yıl milyonlarca akademik makale yayımlanıyor. Bir araştırmacı için asıl soru artık "bilgiye nasıl ulaşırım?" değil, "bu okyanusta benim için önemli olan makaleyi nasıl bulurum?" Yüksek lisans tezimde bu soruya graf teorisi tarafından yaklaşıyorum: atıf ağlarını kullanan çok katmanlı bir makale öneri sistemi. Bu çalışmanın bir bölümü "A Graph-Based Article Recommendation System with Multilayer Citation" başlığıyla ICHORA 2026'da yayımlandı.

Neden atıf ağları?

Atıflar, akademik literatürün doğal grafıdır: her makale bir düğüm, her atıf bir kenar. Bu grafın güzelliği, insan yargısının damıtılmış hali olması — bir yazar bir makaleye atıf verdiyse, aralarında anlamlı bir ilişki olduğuna dair güçlü bir sinyal vardır. Metin benzerliğinin göremediği bağlantıları (ör. farklı terminoloji kullanan ama aynı problemi çözen çalışmalar) atıf yapısı yakalayabilir.

Çift yönlü bakmak

Sistemin temel fikirlerinden biri atıf ilişkisine çift yönlü bakmak:

Referanslar (geriye doğru): Hedef makalenin atıf verdiği çalışmalar — üzerine inşa edildiği temel.
Atıf alanlar (ileriye doğru): Hedef makaleye atıf veren çalışmalar — fikrin nereye evrildiği.

İki yönü birlikte kullanınca, hedef makalenin etrafında zengin bir komşuluk oluşuyor:

Hedef makale etrafında çok katmanlı atıf komşuluğu: geriye doğru referanslar, ileriye doğru atıf verenler ve kesikli çizgili ikincil katman

Ayrıca bibliographic coupling (aynı kaynaklara atıf veren makaleler) ve co-citation (birlikte atıf alan makaleler) gibi klasik bibliyometrik sinyaller de bu komşuluktan doğal olarak türetilebiliyor.

Sistem adım adım nasıl çalışıyor?

Komşuluk inşası: Hedef makaleden başlayarak OpenAlex API'sinden referanslar ve atıf verenler çekilir; bir–iki sıçramalık heterojen bir alt-graf kurulur.
Aday üretimi: Alt-graftaki her makale bir öneri adayıdır; doğrudan komşular ile dolaylı (coupling/co-citation üzerinden ulaşılan) adaylar ayrı işaretlenir.
Sinyal birleşimi: Her aday için yapısal bağlantı gücü, başlık/özet üzerinden anlamsal benzerlik ve yayın mecrası (venue) sinyali hesaplanıp ağırlıklı olarak birleştirilir.
Katmanlı sunum: Yapısal olarak güçlü adaylar birincil, daha uzak ama destekli adaylar ikincil katmanda sıralanır.

Çok katmanlı mimarinin getirisi

Öneri adaylarını tek bir havuza atmak yerine katmanları ayırmak iki şey kazandırıyor. Birincisi yorumlanabilirlik — kullanıcı bir önerinin neden geldiğini görebiliyor: "bu makale, okuduğunuz makaleyle aynı üç kaynağa atıf veriyor" gibi. İkincisi ayarlanabilirlik — katman ağırlıklarıyla oynayarak keşif/isabet dengesi kullanım senaryosuna göre değiştirilebiliyor: literatür taraması yapan biri geniş keşif ister, hakem güncel ve yakın çalışmalar ister.

Sistemin bir diğer bilinçli tercihi: model eğitimi ve kullanıcı verisi gerektirmemesi. Derin öğrenme tabanlı önericiler güçlüdür, ama eğitim verisi, GPU bütçesi ve düzenli yeniden eğitim ister; kararları da kutudan izlenemez. Graf yapısından ve açık metadatadan beslenen bu sistem hafif, şeffaf ve yeniden üretilebilir — ayrıca kullanıcı davranışı toplamadığı için gizlilik tarafı da temiz.

Veri: OpenAlex

Deneyler OpenAlex verisi üzerinde koşuyor. OpenAlex, yüz milyonlarca çalışmayı ve atıf ilişkisini açık API ile sunan devasa bir akademik graf. Ücretsiz ve açık olması, akademik öneri araştırmalarını herkes için erişilebilir kılıyor — ama veri temizliği işin görünmeyen büyük kısmı: mükerrer kayıtlar, eksik atıflar, geri çekilmiş makaleler, alan gürültüsü... Ham grafı "deneye hazır" hale getirmek, boru hattındaki kodun yarısından fazlasını oluşturuyor.

Sınırlar ve sırada ne var?

Atıf tabanlı yaklaşımın doğal bir sınırı var: çok yeni makaleler henüz atıf almadığı için ileri yöndeki sinyalleri zayıf — burada anlamsal benzerlik ve venue sinyali devreye giriyor. Sistemi Precision@k, Recall@k, MAP, MRR ve nDCG ile değerlendiriyorum — bu metriklerin ne anlattığını ayrı bir yazıda ele aldım. Tezin ilerleyen aşamalarında katman ağırlıklarının duyarlılık analizi ve daha büyük alt-graflar üzerinde ölçekleme deneyleri var.