Blog'a dön

AI Ürün Veri Normalizasyonu: Supplier Verisini eBay Item Specifics'e Dönüştürme

AI ürün veri normalizasyonu ile dağınık supplier başlık ve özelliklerini eBay category, item specifics ve doğrulanabilir ürün kayıtlarına güvenle dönüştürün.

AI ürün veri normalizasyonu, supplier açıklamasını daha akıcı yazıya çevirmekten farklıdır. Amaç; “Stainless travel mug 500ml, black, leak resistant” gibi dağınık girdiyi, doğru eBay kategorisine ait standart alanlara ve kaynak gösterilebilir değerlere dönüştürmektir. Yanlış normalizasyon güzel görünen ama filtrelerde kaybolan, hatta alıcıya yanlış ürün vadeden ilan üretir.

Gerçek kataloglarda aynı özellik farklı biçimlerde gelir: `0.5 L`, `500ml`, `500 ml capacity`; `Black`, `Jet Black`, `BK`; `stainless`, `18/8 steel`. AI benzerliği yakalayabilir, fakat “yakın anlamlı” ile “ticari olarak aynı” arasındaki kararı tek başına vermemelidir. Dropshipping supplier data feed karşılaştırması verinin nasıl alındığını açıklar; bu rehber o ham verinin eBay'e uygun iç modele nasıl dönüştürüleceğini ele alır.

Normalizasyon pipeline'ı nedir?

Sağlam pipeline altı ayrı işi birbirine karıştırmaz:

  1. Kaynak içeriği ve dosya sürümünü arşivler.
  2. Supplier SKU, GTIN/MPN ve varyant kimliğini eşler.
  3. Kategori için aday üretir.
  4. Metin ve tablodan aday özellik-değer çiftleri çıkarır.
  5. eBay taxonomy kısıtları, birim ve business rule ile doğrular.
  6. Yalnız güven eşiğini geçen kaydı listing taslağına taşır.

Bu ayrım audit için gereklidir. AI “Material: Stainless Steel” ürettiyse bu değer supplier tablosundan mı, başlıktan mı, görsel yorumundan mı geldi? Kaynak span ve model/rule sürümü saklanmıyorsa hata görüldüğünde nedenini bulamazsınız.

LLM, kurallar ve katalog eşlemesinin dürüst karşılaştırması

YöntemGüçlü tarafıZayıf tarafıEn iyi rol
Regex/kuralTekrarlanabilir, ucuz, açıklanabilirDil ve layout değişince kırılırÖlçü, para birimi, bilinen enum
LLM extractionDağınık metin ve tabloyu yorumlarUydurma, format ve tutarlılık riskiAday değer ve kaynak span çıkarma
Supplier yapılandırılmış feedKaynağa en yakın veriSupplier semantiği yanlış/eksik olabilirOtoriter ürün alanı adayı
eBay katalog/taxonomyGeçerli alan ve değer sınırlarını verirSupplier gerçeğini kanıtlamazŞema ve izin verilen değer doğrulama
İnsan incelemesiBelirsiz ticari bağlamı çözerYavaş ve kişiler arası tutarsızYüksek riskli/ düşük güvenli istisna

“Tam AI” ve “tam manuel” arasında seçim yapmak gereksizdir. LLM esnek extraction yapar; deterministik katman birim ve şemayı doğrular; insan yalnız belirsiz kuyruğu inceler. Hedef insanı sıfırlamak değil, insan dakikasını en riskli kayda ayırmaktır.

Kategori belirlenmeden alan çıkarmayın

`Size`, `Type` veya `Material` gibi kelimelerin anlamı kategoriye göre değişir. Yanlış kategori seçilirse model supplier verisinden mantıklı görünen ama eBay'in o leaf category için tanımadığı alanlar üretir. eBay'in resmî kategori ve aspect keşfi rehberi, Taxonomy API ile uygun leaf category ve ona bağlı required/optional aspect'lerin bulunabileceğini açıklar.

Kategori adayını tek etiket olarak değil skorlanmış liste olarak üretin. Örneğin:

  • `Travel Mugs`: 0,78 — başlık ve kullanım amacı eşleşiyor
  • `Water Bottles`: 0,18 — leak-resistant sinyali var, ancak mug ifadesi güçlü
  • `Vacuum Flasks`: 0,04 — insulation kanıtı yok

İlk iki adayın skoru yakınsa otomatik publish durmalıdır. Category yanlışlığı yalnız SEO problemi değildir; condition seçenekleri, zorunlu alanlar, fee ve policy uygulaması değişebilir.

eBay şemasını çalışma anında doğrulayın

Alan listelerini koda gömüp yıllarca kullanmak güvenli değildir. Kategoriler ve aspect gereksinimleri değişebilir. eBay'in recommended item specific names and values dokümanı, required, recommended ve optional alanların Taxonomy API üzerinden alınabildiğini; yakında zorunlu olacak alan için `expectedRequiredByDate` verilebildiğini belirtir.

Her kategori için şu metadata'yı cache'leyin ama sürüm/tarih saklayın:

  • Localized aspect name
  • Required/recommended/optional durumu
  • Tek veya çoklu değer cardinality'si
  • İzin verilen değerler ve free-text durumu
  • Maksimum uzunluk ve veri tipi
  • Yaklaşan required tarihi

Metadata yenilendiğinde mevcut ilanları anında toplu değiştirmeyin. Önce diff çıkarın, etkilenen SKU sayısını görün ve yeni zorunlu alanı kaynağın gerçekten sağlayıp sağlamadığını test edin.

Kanıtlı değer ve confidence tasarımı

Tek bir genel confidence skoru yeterli değildir. “Model kendine ne kadar güveniyor?” ile “kaynak ne kadar güçlü?” ayrılmalıdır. Örnek kayıt şu parçaları taşır:

  • `normalized_value`: Stainless Steel
  • `source_value`: 18/8 food grade steel body
  • `source_location`: specifications.material
  • `source_authority`: supplier_structured
  • `extraction_confidence`: 0.97
  • `mapping_confidence`: 0.93
  • `validation_status`: allowed_value
  • `review_status`: auto_accepted

Görselden çıkarılan renk yüksek confidence taşısa bile aydınlatma nedeniyle source authority düşük olabilir. Supplier tablosundaki MPN ise yüksek otorite taşır. Eşik alan bazlı olmalıdır: pazarlama rengi otomatik kabul edilebilirken electrical voltage, safety certification veya vehicle fitment insan kontrolü isteyebilir.

Birim dönüşümünde sessiz hata yapmayın

AI `12 x 8 x 4` gördüğünde birimi ve boyut sırasını bilemez. Supplier sayfasının genelinde inch kullanılıyor diye bu alanı inch varsaymak yanlış olabilir. Kaynak birim açık değilse değer `ambiguous_unit` durumuna gitmelidir.

Güvenli dönüşüm kaydı orijinal değeri korur: `source: 500 ml`, `normalized: 0.5`, `unit: L`, `conversion_rule: ml_to_l_v2`. Yuvarlama politikası da yazılı olmalıdır. Kargo ölçüsünde 19,95 cm'yi 20 cm yapmak kabul edilebilirken uyumluluk parçasında tolerans kritik olabilir.

Renk ve materyal de basit değildir. `Leather look`, `faux leather` ve `leather` aynı değere normalize edilmemelidir. “Compatible with” ifadesinden OEM üretici çıkarılamaz. AI açıklama denetimi claim riskini içerik katmanında ele alır; normalizasyon katmanı bu farkı daha metin yazılmadan korumalıdır.

Unknown, null ve not applicable ayrımı

Eksik değerlerin hepsini boş string yapmak veri kaybıdır:

  • Unknown: Özellik ürün için anlamlı, fakat kaynakta bilgi yok.
  • Not applicable: Özellik bu ürün için geçerli değil.
  • Not provided: Supplier alanı bilerek göndermemiş olabilir.
  • Extraction failed: Veri var ama parser/model okuyamamış olabilir.
  • Conflicting: İki kaynak farklı değer veriyor.

Bu durumlar farklı aksiyon ister. Required alan unknown ise listing bloke edilir. Optional alan unknown kalabilir. Extraction failed yeniden işlenir. Conflicting kayıt insan kuyruğuna gider. AI'ın boşluğu “makul” değerle tamamlaması bu teşhis imkanını yok eder.

Kaliteyi altın veri setiyle ölçün

Demo sırasında beş doğru ürün görmek üretim kalitesini kanıtlamaz. Farklı supplier, kategori, dil, tablo düzeni ve varyant içeren en az 100-200 elle doğrulanmış ürünlük altın veri seti kurun. Alan bazında precision, recall ve exact match ölçün.

Ticari risk için weighted accuracy daha anlamlıdır. Yanlış `Brand`, `Voltage`, `Condition` veya fitment değeri; eksik marketing colour'dan daha yüksek ceza almalıdır. Ayrıca şu üretim metriklerini izleyin:

  • Otomatik kabul oranı
  • Manual review oranı ve dakika/kayıt
  • Required aspect completeness
  • Publish rejection ve warning oranı
  • Yayın sonrası alan düzeltme oranı
  • Normalizasyon kaynaklı INAD/iade sayısı

Model güncellendiğinde aynı altın veri setinde regresyon testi yapılmadan bütün kataloğu yeniden işlemeyin.

TurkoLister ile kontrollü normalizasyon pilotu

TurkoLister free trial ile üç farklı supplier'dan 30'ar ürün seçin. Önce supplier verisini saklayın; sonra AI title, category, item specifics ve açıklama taslağını üretin. Her normalize alan için kaynağın gerçekten destekleyip desteklemediğini kontrol edin ve düzeltme nedenini kaydedin.

TurkoLister'ın avantajı AI metni kâr, stok-fiyat ve listing workflow'undan koparmamasıdır. Dürüst sınırı ise şudur: hiçbir araç kötü supplier verisini kendiliğinden doğru ürün gerçeğine dönüştüremez. Pilot kararı; hız kadar required completeness, yanlış claim, manuel düzeltme süresi ve yayın sonrası hata üzerinden verilmelidir.

Sonuç

AI ürün veri normalizasyonu, serbest metinden güzel JSON alma gösterisi değildir. Kategori önce belirlenmeli, eBay taxonomy canlı metadata ile doğrulanmalı, her değer kaynak ve confidence taşımalı, unknown alanlar uydurulmamalıdır. LLM aday çıkarma için; kurallar birim ve enum için; insan ise belirsiz ticari karar için kullanılmalıdır. Bu katman doğru kurulursa AI ilan üretimini hızlandırır; yanlış kurulursa supplier hatasını katalog ölçeğinde çoğaltır.

Sık Sorulan Sorular

AI supplier açıklamasından item specifics çıkarabilir mi?

Evet, AI başlık, tablo ve açıklamadan aday özellikler çıkarabilir. Ancak değerlerin kaynak kanıtı, eBay kategori kısıtı ve güven skoru olmadan doğrudan yayına gönderilmemesi gerekir.

LLM mi kural tabanlı normalizasyon mu daha doğru?

Sabit birim, enum ve SKU eşleşmelerinde kurallar daha öngörülebilirdir; dağınık dil ve tablo yorumunda LLM daha esnektir. En güvenli üretim modeli, kurallar ve taxonomy doğrulamasıyla sınırlandırılmış hibrit akıştır.

Eksik özellik AI tarafından tahmin edilmeli mi?

Hayır. Başlık veya görsel güçlü kanıt sağlamıyorsa alan unknown ya da manual review olarak kalmalıdır. Yayınlanabilir boşluk, uydurulmuş kesin değerden daha güvenlidir.

TurkoLister veri normalizasyonunda ne sağlar?

TurkoLister supplier ürün verisini AI listing, category, item specifics, kâr ve risk kontrolleriyle aynı workflow'da ele alarak ham verinin insan denetiminden sonra yayına hazırlanmasını kolaylaştırır.