Bei uns wirst du...
* ein Verfahren entwickeln, das Ground-Truth-Labels mit fotografierten oder gescannten Handschriften vergleicht, um Inkonsistenzen zu identifizieren und die Trainingsdatenqualität zu verbessern.
* dabei moderne OCR-Technologien (Optical Character Recognition) einsetzen, um handschriftliche Inhalte zu analysieren und mit den Sensordaten abzugleichen.
* zusätzliche Ground-Truth-Daten durch Fotos oder Scans handschriftlicher Texte sammeln.
* vortrainierte OCR-Modelle zur Segmentierung, Texterkennung und Bounding-Box-Detektion anwenden und ggf. anpassen.
* ein automatisiertes Vergleichsmodul zur Erkennung von Abweichungen zwischen erkannter Schrift und Ground-Truth-Labels entwickeln.
* typische Fehlerquellen identifizieren, wie: Rechtschreibfehler; ausgelassene Buchstaben oder Satzzeichen; unleserliche Handschrift, die für das Training ungeeignet ist.
* die Qualitätsverbesserung durch die bereinigten Trainingsdaten bewerten.
Wir freuen uns, wenn du...
* Kenntnisse und Erfahrungen in Deep Learning in PyTorch mitbringst.
* Interesse an Handschrifterkennung und Zeitreihenanalyse hast.
* Deutschkenntnisse zur Unterstützung bei der Datenerhebung mitbringst.
Unsere STABILO-verliebte
Marion
freut sich schon auf deine Unterlagen. Sag ihr auch gleich noch, wann du bei uns anfangen kannst und wie lange du bleiben möchtest. Wir sind gespannt auf dich