Skip to main content
Case Study|NovaScan Technologies|

NovaScan: Depo Lojistiği için Gerçek Zamanlı Nesne Tespiti

CoreML tarafından desteklenen bir iOS uygulaması oluşturduk; bu uygulama envanter öğelerini gerçek zamanlı olarak tanımlamakta ve takip etmekte, 12 depo konumu genelinde manuel tarama süresini %73 oranında azaltmıştır.

73%

Daha hızlı tarama

99.2%

Envanter doğruluğu

12

Depo konumları

50K+

Günlük tanımlamalar

Zorluk

NovaScan Technologies, BAE ve Suudi Arabistan'da 12 depo tesisini işletmekte ve günlük 50.000'den fazla envanter öğesini işlemektedir. Mevcut iş akışları, çalışanların her bir öğedeki barkodları manuel olarak taramasını gerektiriyordu — bu işlem yoğun saatlerde önemli darboğazlar oluşturuyor ve insan hatası için açık bir kapı bırakıyordu.

Temel sorun üç yönlüydü: barkod etiketleri sıklıkla hasar görmüş veya kapalıydı, tarama, çalışanların her bir öğeyi tek tek işlemesini gerektiriyordu (iş hacmini yavaşlatıyor), ve mevcut sistem barkodsuz öğeleri tanıyamıyordu. NovaScan, barkodlara güvenmeden ürünleri görsel olarak tanıyabilen — şekil, renk, paketleme ve etiket metni ile — bir çözüme ihtiyaç duyuyordu.

Birkaç ajans ve danışmanlık firmasıyla konuşmuşlardı, ancak çoğu sabit internet bağlantısı gerektiren bulut tabanlı çözümler önermiştir — bu, güvenilmez WiFi'li depo ortamlarında başlatılamayacak bir durumdur. Çalışanlarına zaten dağıtılmış olan standart iPad'lerde çevrimdışı, gerçek zamanlı olarak çalışan cihaz üzerinde çıkarım ihtiyaçları vardı.

Yaklaşımımız

İki haftalık bir keşif aşamasıyla başladık. Ekibimiz iki NovaScan deposunu ziyaret etti, mevcut tarama iş akışını gözlemledi, çeşitli aydınlatma koşulları altında 3.000'den fazla benzersiz ürün öğesinin fotoğrafını çekti ve depo personeline sorun noktaları hakkında görüş sordu. Bu saha çalışması, bunu takip eden her teknik kararı bilgilendirdi.

ML modeli için temel mimari olarak YOLOv8'i seçtik — doğruluktan ödün vermeden hız için optimize edilmiş. Bunu toplanan depo görselleri veri seti üzerinde eğittik (rotasyonlar, aydınlatma varyasyonları ve kısmi oklüzyonlarla 15.000 görüntüye artırılmış), ardından modeli iPad'de cihaz üzerinde çıkarım için CoreML formatına dönüştürdük.

Uygulama, Swift ile SwiftUI kullanarak yerel olarak oluşturuldu. Çapraz platform yerine yerel seçtik, özellikle CoreML performansı için: model Apple Neural Engine'de çalışır, kamera karelerini saniyede 30 kare hızında işler ve ortalama 14ms çıkarım süresi vardır. Kamera boru hattı doğrudan donanım erişimi için AVFoundation kullanır ve pil tüketimini azaltmak için yinelenen kareleri atlayan özel kare işlemesi vardır.

Backend'de, iPad'in bağlantısı olduğunda envanter verilerini senkronize eden hafif bir Supabase API'si oluşturduk. Uygulama tamamen çevrimdışı çalışır — tarama, tanımlama ve yerel envanter güncellemeleri hiçbir ağ bağlantısı olmadan gerçekleşir. WiFi kullanılabilir hale geldiğinde, beklemede olan değişiklikleri arka planda senkronize eder.

Temel teknik kararlar

Model boyutu vs doğruluk dengesi: Üç YOLOv8 varyantını test ettik (nano, small, medium). Small varyantı test setimizde %96,8 mAP elde ederken CoreML modelini 25MB'ın altında tuttu — bu, paylaşılan depo iPad'lerinde hızlı uygulama başlatması ve düşük bellek ayak izi için kritiktir.

Güven eşiği belirleme: Belirsiz tahminleri göstermek yerine, üç seviyeli bir güven sistemi uyguladık. %90 üzeri: otomatik eşleşme (yeşil kaplama). %70-90: önerilen eşleşme (sarı kaplama, onaylamak için dokunun). %70 altı: manuel arama istenir. Bu, belirsiz eşleşmeler için hızı korurken yanlış tanımlamaları sıfıra yakına indirdi.

Artımlı model güncellemeleri: NovaScan'in envanterine yeni ürünler eklendikçe modeli aylık olarak yeniden eğitmesine olanak tanıyan bir model güncelleme hattı oluşturduk. Güncellenmiş modeller, MDM (Mobile Device Management) aracılığıyla tüm depo iPad'lerine, App Store üzerinden uygulama güncellemesi gerektirmeden dağıtılır.

Sonuçlar ve etki

Uygulama iki depoda pilot olarak başlatılmış ve hemen sonuçlar vermiştir. Manuel tarama süresi %73 düştü — işçiler artık iPad'i bir rafa doğrultup bunları tek tek taramak yerine aynı anda birden fazla ürünü tanımlayabiliyorlardı. Envanter doğruluğu %94,1'den %99,2'ye çıktı ve pahalı stok tutarsızlıklarını ortadan kaldırdı.

Pilot sonrasında NovaScan uygulamayı 60 gün içinde 12 konumun tümüne dağıttı. Sistem şimdi ağları genelinde günde 50.000'den fazla ürün tanımlaması işliyor. ROI, ilk çeyrekte sağlandı — tarama işçiliğinde ve envanter hatalarında sağlanan azalma, geliştirme yatırımını fazlasıyla karşıladı.

NovaScan o zamandan beri bizi 2. faz için kiraladı: iPad Pro'da LiDAR kullanarak raf seviyesi uzamsal haritalaması ekleme, bu da otomatik stok seviyesi tespiti ve yeniden sipariş uyarılarını sağlayacak.

Öğrenilen dersler

Bilgisayar görüşü projeleri için saha araştırması kaçınılmazdır. Depo ziyaretlerimiz, masa başında tahmin edilmesi imkânsız olacak aydınlatma koşullarını, öğelerin oryantasyonunu ve uç durumları ortaya çıkarmıştır. Keşif için harcadığımız iki hafta en az bir ay yeniden çalışmaktan kurtarmıştır.

Çevrimdışı-birinci, kurumsal uygulamalar için doğru varsayılandır. WiFi'nin bulunduğu ortamlarda bile ağ güvenilirliği değişiklik gösterir. Çevrimdışı-birinci olarak oluşturmak ve senkronizasyonu daha sonra eklemek, bulut bağımlı bir uygulamaya çevrimdışı desteği takma-tertip etmekten çok daha kolaydır.

Tech Stack

SwiftSwiftUICoreMLYOLOv8AVFoundationSupabasePostgreSQL
We needed computer vision expertise and iHux delivered. Their CoreML integration runs inference in under 50ms on-device. The technical depth of this team is impressive.

James Chen

CTO, NovaScan