28 lutego 2026
Wiadomości

A.B.C. – A.I. Book Cataloguer: od koncepcji do dzialajacego prototypu

28 lutego 2026   |   Wiadomości   |  

Ten artykul jest kontynuacja naszego poprzedniego wpisu: Axelera AI Smarter Spaces Project Challenge, w ktorym oglosilismy nasz udzial w challenge.

Od koncepcji do dzialajacego prototypu: nasza droga przez Axelera Project Challenge.

Projekt

A.B.C. („A.I. Book Cataloguer”) to system edge-AI do automatycznej katalogizacji ksiazek, opracowany przez nas w Denovo, wloskim startupie, w ramach Axelera Project Challenge 27. Projekt zostal po raz pierwszy ogloszony na spolecznosci Axelera 3 grudnia 2025 i osiagnal etap w pelni dzialajacego prototypu 25 lutego 2026, a finalna dokumentacja zostala opublikowana 28 lutego 2026.

Podstawowa idea jest prosta, ale skuteczna: wyeliminowac reczna prace zwiazana z katalogizacja ksiazek – wolna, powtarzalna i podatna na bledy – zastepujac ja inteligentna stacja biurkowa, ktora automatycznie skanuje okladke ksiazki i wyodrebnia tytul, autora oraz wydawce w czasie rzeczywistym, bez potrzeby polaczenia z chmura.

Zespol

Jestesmy innowacyjnym startupem z obszaru mechatroniki sterowanej przez AI, niewielkim miedzynarodowym zespolem, w skladzie:

  • Dwoch wloskich inzynierow
  • Jedna polska project manager

Wiecej informacji o zespole znajduje sie na stronie O nas.

A.B.C. to nasz pierwszy prawdziwy projekt edge-AI, zrealizowany dzieki zestawowi sprzetowemu dostarczonemu przez Axelera w ramach challenge.

Problem, ktory rozwiazuje A.B.C.

Digitalizacja zbiorow ksiazkowych byla historycznie procesem wolnym i pracochlonnym. Operatorzy musza czytac kazda ksiazke, wprowadzac dane recznie i poprawiac ewentualne bledy – co znacznie spowalnia prace i obniza jakosc metadanych.

A.B.C. ma za zadanie wyeliminowac to waskie gardlo przez automatyzacje ekstrakcji informacji i wprowadzenie naturalnego, opartego na gestach mechanizmu korekty, czyniac caly proces szybszym, dokladniejszym i znacznie bardziej intuicyjnym.

Potencjalne zastosowania obejmuja biblioteki, antykwariaty i sklepy z komiksami, gdzie ciagla katalogizacja stale zmieniajacego sie asortymentu stanowi konkretne i kosztowne wyzwanie.

Sprzet

System zostal zbudowany wokol zestawu dostarczonego przez Axelera, ktory przyjechal z Holandii pod koniec grudnia 2025. Komponenty wykorzystane w finalnej konfiguracji to:

  • SBC: Orange Pi 5 Plus
  • Akcelerator NPU: Axelera Metis M.2
  • Kamera: Sonoff CAM S2
  • Siec lokalna: router TP-Link z bezposrednim polaczeniem Ethernet
  • Mocowanie kamery: lampa pierscieniowa z regulowanym ramieniem
  • Poziomowanie: podwojna poziomica przy kamerze
  • Pamiec: karta SD
  • Wyswietlacz: monitor

Oprogramowanie i pipeline AI

Po kilku iteracjach przyjelismy finalne rozwiazanie oparte na PP-OCR (PaddleOCR v3 Latin) w trybie hybrydowym, po odrzuceniu EasyOCR, Tesseract oraz kilku LLM-ow (ktore okazaly sie zbyt „kreatywne”, wymyslaly dane zamiast je poprawiac).

Kompletny pipeline obejmuje:

  1. Akwizycje RTSP z kamery i przyciecie obszaru ladowania za pomoca OpenCV
  2. Detekcje ksiazki przy uzyciu YOLOv8l na NPU Metis
  3. Hybrydowy sub-pipeline OCR: wykrywanie blokow tekstu na Metis i wlasciwa akwizycja OCR na CPU z nowszym, dokladniejszym modelem
  4. Fuzzy matching wzgledem lokalnej bazy danych (12 GB dump Open Library)
  5. Wyswietlenie wyniku i oczekiwanie na gest operatora

Interakcja operatora i UX

Operator wchodzi w interakcje z systemem w sposob calkowicie bezdotykowy, oparty na gestach:

  • Polozenie ksiazki w obszarze ladowania automatycznie uruchamia proces
  • Zsuniecie ksiazki potwierdza akwizycje – pokazywany jest duzy zielony znak zatwierdzenia, a dane sa zapisywane do lokalnego pliku CSV
  • Pokazanie skrzyzowanych palcow (ksztalt X) pod kamera wyzwala odrzucenie – pokazywany jest duzy czerwony X
  • Obie akcje maja pasek czasu, dajacy operatorowi okno na przerwanie dzialania

W fazie koncowej dodano system polecen za pomoca kodow QR, pozwalajacy operatorowi uruchomic ponowna kalibracje, wlaczyc/wylaczyc diagnostyke i obslugiwac czyste wylaczanie Orange Pi.

Harmonogram projektu

  • 3 grudnia 2025: pierwszy post opublikowany na spolecznosci Axelera
  • 20 grudnia 2025: zestaw sprzetowy otrzymany z Holandii
  • 12 stycznia 2026: pelne unboxing, instalacja Voyager SDK, pierwszy test z „inference.py”
  • 1 lutego 2026: konfiguracja fizyczna, integracja z baza Open Library, kod opublikowany na GitHub
  • 23 lutego 2026: kompletny pipeline, przejscie na PaddleOCR v3, finalny debug
  • 25 lutego 2026: ukonczony dzialajacy prototyp
  • 28 lutego 2026: finalna dokumentacja i zweryfikowana konfiguracja fizyczna

Axelera promuje projekt

10 kwietnia 2026 Axelera publicznie wypromowala nasz projekt na swoim profilu LinkedIn: zobacz wpis.

Wyniki i perspektywy

System zostal pomyslnie ukonczony w czasie trwania challenge. Finalny prototyp dziala calkowicie offline (z jedynym wyjatkiem polaczenia Wi-Fi miedzy kamera a lokalnym access pointem) i pokazuje wykonalnosc systemu automatycznej katalogizacji dzialajacego na niedrogim sprzecie edge.

Caly kod, dokumentacja, instrukcje, kody QR, obrazy oraz plik „.stl” uchwytu dla Orange Pi sa swobodnie dostepne w repozytorium GitHub projektu: github.com/denovo-it/abc.

Projekt rozwijany przez nas w Denovo w ramach Axelera Project Challenge 27 – grudzien 2025 / marzec 2026.

ABC (AI Book Cataloguer) to jeden z publicznych projektów z naszego obszaru sztuczna inteligencja Terni, centralne Włochy, rozwijany wewnętrznie obok mechatronika Terni, centralne Włochy, blockchain Terni, centralne Włochy oraz cyberbezpieczeństwo Terni, centralne Włochy.

Preferenze cookie