A.B.C. – A.I. Book Cataloguer: od koncepcji do dzialajacego prototypu
28 lutego 2026 | Wiadomości |
Ten artykul jest kontynuacja naszego poprzedniego wpisu: Axelera AI Smarter Spaces Project Challenge, w ktorym oglosilismy nasz udzial w challenge.
Od koncepcji do dzialajacego prototypu: nasza droga przez Axelera Project Challenge.
Projekt
A.B.C. („A.I. Book Cataloguer”) to system edge-AI do automatycznej katalogizacji ksiazek, opracowany przez nas w Denovo, wloskim startupie, w ramach Axelera Project Challenge 27. Projekt zostal po raz pierwszy ogloszony na spolecznosci Axelera 3 grudnia 2025 i osiagnal etap w pelni dzialajacego prototypu 25 lutego 2026, a finalna dokumentacja zostala opublikowana 28 lutego 2026.
Podstawowa idea jest prosta, ale skuteczna: wyeliminowac reczna prace zwiazana z katalogizacja ksiazek – wolna, powtarzalna i podatna na bledy – zastepujac ja inteligentna stacja biurkowa, ktora automatycznie skanuje okladke ksiazki i wyodrebnia tytul, autora oraz wydawce w czasie rzeczywistym, bez potrzeby polaczenia z chmura.
Zespol
Jestesmy innowacyjnym startupem z obszaru mechatroniki sterowanej przez AI, niewielkim miedzynarodowym zespolem, w skladzie:
- Dwoch wloskich inzynierow
- Jedna polska project manager
Wiecej informacji o zespole znajduje sie na stronie O nas.
A.B.C. to nasz pierwszy prawdziwy projekt edge-AI, zrealizowany dzieki zestawowi sprzetowemu dostarczonemu przez Axelera w ramach challenge.
Problem, ktory rozwiazuje A.B.C.
Digitalizacja zbiorow ksiazkowych byla historycznie procesem wolnym i pracochlonnym. Operatorzy musza czytac kazda ksiazke, wprowadzac dane recznie i poprawiac ewentualne bledy – co znacznie spowalnia prace i obniza jakosc metadanych.
A.B.C. ma za zadanie wyeliminowac to waskie gardlo przez automatyzacje ekstrakcji informacji i wprowadzenie naturalnego, opartego na gestach mechanizmu korekty, czyniac caly proces szybszym, dokladniejszym i znacznie bardziej intuicyjnym.
Potencjalne zastosowania obejmuja biblioteki, antykwariaty i sklepy z komiksami, gdzie ciagla katalogizacja stale zmieniajacego sie asortymentu stanowi konkretne i kosztowne wyzwanie.
Sprzet
System zostal zbudowany wokol zestawu dostarczonego przez Axelera, ktory przyjechal z Holandii pod koniec grudnia 2025. Komponenty wykorzystane w finalnej konfiguracji to:
- SBC: Orange Pi 5 Plus
- Akcelerator NPU: Axelera Metis M.2
- Kamera: Sonoff CAM S2
- Siec lokalna: router TP-Link z bezposrednim polaczeniem Ethernet
- Mocowanie kamery: lampa pierscieniowa z regulowanym ramieniem
- Poziomowanie: podwojna poziomica przy kamerze
- Pamiec: karta SD
- Wyswietlacz: monitor
Oprogramowanie i pipeline AI
Po kilku iteracjach przyjelismy finalne rozwiazanie oparte na PP-OCR (PaddleOCR v3 Latin) w trybie hybrydowym, po odrzuceniu EasyOCR, Tesseract oraz kilku LLM-ow (ktore okazaly sie zbyt „kreatywne”, wymyslaly dane zamiast je poprawiac).
Kompletny pipeline obejmuje:
- Akwizycje RTSP z kamery i przyciecie obszaru ladowania za pomoca OpenCV
- Detekcje ksiazki przy uzyciu YOLOv8l na NPU Metis
- Hybrydowy sub-pipeline OCR: wykrywanie blokow tekstu na Metis i wlasciwa akwizycja OCR na CPU z nowszym, dokladniejszym modelem
- Fuzzy matching wzgledem lokalnej bazy danych (12 GB dump Open Library)
- Wyswietlenie wyniku i oczekiwanie na gest operatora
Interakcja operatora i UX
Operator wchodzi w interakcje z systemem w sposob calkowicie bezdotykowy, oparty na gestach:
- Polozenie ksiazki w obszarze ladowania automatycznie uruchamia proces
- Zsuniecie ksiazki potwierdza akwizycje – pokazywany jest duzy zielony znak zatwierdzenia, a dane sa zapisywane do lokalnego pliku CSV
- Pokazanie skrzyzowanych palcow (ksztalt X) pod kamera wyzwala odrzucenie – pokazywany jest duzy czerwony X
- Obie akcje maja pasek czasu, dajacy operatorowi okno na przerwanie dzialania
W fazie koncowej dodano system polecen za pomoca kodow QR, pozwalajacy operatorowi uruchomic ponowna kalibracje, wlaczyc/wylaczyc diagnostyke i obslugiwac czyste wylaczanie Orange Pi.
Harmonogram projektu
- 3 grudnia 2025: pierwszy post opublikowany na spolecznosci Axelera
- 20 grudnia 2025: zestaw sprzetowy otrzymany z Holandii
- 12 stycznia 2026: pelne unboxing, instalacja Voyager SDK, pierwszy test z „inference.py”
- 1 lutego 2026: konfiguracja fizyczna, integracja z baza Open Library, kod opublikowany na GitHub
- 23 lutego 2026: kompletny pipeline, przejscie na PaddleOCR v3, finalny debug
- 25 lutego 2026: ukonczony dzialajacy prototyp
- 28 lutego 2026: finalna dokumentacja i zweryfikowana konfiguracja fizyczna
Axelera promuje projekt
10 kwietnia 2026 Axelera publicznie wypromowala nasz projekt na swoim profilu LinkedIn: zobacz wpis.
Wyniki i perspektywy
System zostal pomyslnie ukonczony w czasie trwania challenge. Finalny prototyp dziala calkowicie offline (z jedynym wyjatkiem polaczenia Wi-Fi miedzy kamera a lokalnym access pointem) i pokazuje wykonalnosc systemu automatycznej katalogizacji dzialajacego na niedrogim sprzecie edge.
Caly kod, dokumentacja, instrukcje, kody QR, obrazy oraz plik „.stl” uchwytu dla Orange Pi sa swobodnie dostepne w repozytorium GitHub projektu: github.com/denovo-it/abc.
Projekt rozwijany przez nas w Denovo w ramach Axelera Project Challenge 27 – grudzien 2025 / marzec 2026.
ABC (AI Book Cataloguer) to jeden z publicznych projektów z naszego obszaru sztuczna inteligencja Terni, centralne Włochy, rozwijany wewnętrznie obok mechatronika Terni, centralne Włochy, blockchain Terni, centralne Włochy oraz cyberbezpieczeństwo Terni, centralne Włochy.