NovaScan : Détection d'objets en temps réel pour la logistique d'entrepôt
Nous avons développé une application iOS alimentée par CoreML qui identifie et suit les articles d'inventaire en temps réel, réduisant le temps de numérisation manuel de 73 % dans 12 emplacements d'entrepôt.
73%
Numérisation plus rapide
99.2%
Précision de l'inventaire
12
Emplacements d'entrepôt
50K+
Identifications quotidiennes
Le défi
NovaScan Technologies exploite 12 installations d'entrepôt aux Émirats arabes unis et en Arabie saoudite, traitant plus de 50 000 articles d'inventaire quotidiennement. Leur flux de travail existant obligeait les travailleurs à scanner manuellement les codes-barres de chaque article — un processus qui créait des goulots d'étranglement importants pendant les heures de pointe et était sujet aux erreurs humaines.
Le problème fondamental était triple : les étiquettes de code-barres étaient souvent endommagées ou obscurcies, le scan obligeait les travailleurs à manipuler chaque article individuellement (ralentissant le débit), et le système existant ne pouvait pas identifier les articles sans leur code-barres. NovaScan avait besoin d'une solution capable d'identifier visuellement les produits — par forme, couleur, emballage et texte d'étiquette — sans dépendre des codes-barres.
Ils avaient parlé à plusieurs agences et cabinets de conseil, mais la plupart proposaient des solutions basées sur le cloud qui nécessiteraient une connectivité Internet constante — ce qui ne fonctionnait pas dans les environnements d'entrepôt avec une connexion WiFi peu fiable. Ils avaient besoin d'une inférence sur appareil qui fonctionnait hors ligne, en temps réel, et sur les iPads standard déjà déployés auprès de leur personnel.
Notre approche
Nous avons commencé par une phase de découverte de deux semaines. Notre équipe a visité deux entrepôts NovaScan, observé le flux de travail de numérisation existant, photographié plus de 3 000 articles de produits uniques sous diverses conditions d'éclairage, et interrogé le personnel d'entrepôt sur les points faibles. Ce travail sur le terrain a informé chaque décision technique qui a suivi.
Pour le modèle ML, nous avons choisi YOLOv8 comme architecture de base — optimisée pour la vitesse sans sacrifier la précision. Nous l'avons entraîné sur notre ensemble de données d'imagerie d'entrepôt collecté (augmenté à 15 000 images avec rotations, variations d'éclairage et occultations partielles), puis avons converti le modèle au format CoreML pour l'inférence sur appareil sur iPad.
L'application a été construite de manière native en Swift avec SwiftUI. Nous avons choisi le natif plutôt que multiplateforme spécifiquement pour les performances de CoreML : le modèle s'exécute sur le Neural Engine d'Apple, traitant les images de la caméra à 30fps avec un temps d'inférence moyen de 14ms. Le pipeline de caméra utilise AVFoundation pour un accès direct au matériel, avec un traitement de cadre personnalisé qui ignore les cadres en double pour réduire la consommation de batterie.
Sur le backend, nous avons construit une API Supabase légère qui synchronise les données d'inventaire lorsque l'iPad a une connexion. L'application fonctionne entièrement hors ligne — la numérisation, l'identification et les mises à jour d'inventaire locales se font sans connexion réseau. Quand le WiFi devient disponible, elle synchronise les modifications en attente en arrière-plan.
Décisions techniques clés
Compromis entre la taille du modèle et la précision : Nous avons testé trois variantes de YOLOv8 (nano, small, medium). La variante small a atteint 96,8% de mAP sur notre ensemble de test tout en gardant le modèle CoreML sous 25MB — essentiel pour un démarrage rapide de l'application et une faible empreinte mémoire sur les iPads partagés des entrepôts.
Seuillage de confiance : Au lieu d'afficher des prédictions incertaines, nous avons mis en œuvre un système de confiance à trois niveaux. Au-dessus de 90% : correspondance automatique (superposition verte). 70-90% : correspondance suggérée (superposition jaune, appuyer pour confirmer). Au-dessous de 70% : recherche manuelle proposée. Cela a réduit les mauvaises identifications à pratiquement zéro tout en maintenant la rapidité pour les correspondances claires.
Mises à jour incrémentielles du modèle : Nous avons construit un pipeline de mise à jour de modèle qui permet à NovaScan de réentraîner le modèle mensuellement à mesure que de nouveaux produits sont ajoutés à l'inventaire. Les modèles mis à jour sont distribués via MDM (Mobile Device Management) à tous les iPads des entrepôts sans nécessiter des mises à jour d'applications via l'App Store.
Résultats et impact
L'application a été lancée en tant que pilote dans deux entrepôts et a livré des résultats immédiats. Le temps de numérisation manuelle a chuté de 73% — les travailleurs pouvaient maintenant pointer l'iPad vers une étagère et identifier plusieurs articles simultanément au lieu de les scanner un par un. La précision de l'inventaire s'est améliorée de 94,1% à 99,2%, éliminant les coûteux écarts de stock.
Après le pilote, NovaScan a déployé l'application à l'ensemble des 12 emplacements en 60 jours. Le système traite maintenant plus de 50 000 identifications d'articles par jour sur son réseau. Le ROI a été atteint au premier trimestre — la réduction du travail de numérisation et des erreurs d'inventaire a plus que couvert l'investissement en développement.
NovaScan nous a depuis engagés pour la phase 2 : ajouter une cartographie spatiale au niveau des rayons utilisant LiDAR sur iPad Pro, ce qui permettra la détection automatique des niveaux de stock et les alertes de réapprovisionnement.
Leçons apprises
La recherche sur le terrain est non-négociable pour les projets de vision par ordinateur. Nos visites d'entrepôt ont révélé des conditions d'éclairage, des orientations d'articles et des cas limites qu'il aurait été impossible d'anticiper depuis un bureau. Les deux semaines que nous avons consacrées à la découverte ont économisé au moins un mois de rework.
Offline-first est la bonne approche par défaut pour les applications d'entreprise. Même dans les environnements dotés du WiFi, la fiabilité du réseau varie. Construire offline-first et ajouter la synchronisation plus tard est bien plus facile que de rétrofiter le support offline dans une application dépendante du cloud.
Services
Tech Stack
“We needed computer vision expertise and iHux delivered. Their CoreML integration runs inference in under 50ms on-device. The technical depth of this team is impressive.”
James Chen
CTO, NovaScan