Ahoj. Hladame programatora, ktory nam pomoze vytvorit parser, ktory bude z PDF vytahovat urcitu informaciu. Najlepsie v pythone, ale moze byt aj PHP. Ma to byt konzolovy skript.
Vytahovat chceme informacie o pocte zamestnancov vo firmach ("
Priemerný prepočítaný počet zamestnancov")
, ktore zverejnili taktuo info v prilohe ich uctovnej zavierky. Priklady nizsie.
Zoznam dokumentov na rozparsovanie vieme dodat v nejakom JSONe, CSV, ... co si dohodneme. Vystup najslepsie v JSONe aby sme si to mohli imporotvat do systemu.
Priklady dokumentov tu. Vacsinou su to PDF, ale bolo by dobre pouvazovat aj nad doc, alebo jpg. Zacneme ale PDF a dalsie formaty mozeme rozdiskutovat.
http://www.registeruz.sk/cruz-public/domain/financialreport/attachment/7148452
http://www.registeruz.sk/cruz-public/domain/financialreport/attachment/6672330
http://www.registeruz.sk/cruz-public/domain/financialreport/attachment/7088247
Požadovaný dátum odovzdania: 31.08.2019Autor cenovej ponuky | Hodnotenie autora ponuky | Dátum pridania ponuky | Odhadovaný počet dní na vypracovanie | Suma za vypracovanie |
---|
Pridajte si Vašu požiadavku na projekt, vyberte si najvhodnejšiu ponuku pre Vás a myslite na to, že v prípade problému v tom nie ste sami. Sme tu na to aby sme problém vyriešili za Vás!