PLKOŠ.net
http://www.plkos.net/

VHA Inventáře v PDF přepsat do textu.. .
http://www.plkos.net/viewtopic.php?f=25&t=308
Stránka 3 z 3

Autor:  PSM [ sob 05. srp 2017 0:49:16 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

A pokračuji v tom co je na stole hotové -přepsané ..
Dnes je ukončený přepis HŠ/Etapní oddělení.
a pokračuji na ,,Školní a výcvikové oddělení,,.

Sumárně je to u 1, 2, 3, 4, oddělení více než 30 000 ,,čéjéček,,
Doba hledání nad těch cca 30000 čeječek je cca méně než 3 sekundy a zaberou hodně pod 3 MB ..
Jen tak na okraj ty poslední dvě oddělení jsou zase hubené :)

Autor:  PSM [ sob 05. srp 2017 1:09:58 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

Ilustrační :)
jak vidíte pod jedním názvem je více čéječek -to je problém ...protože každý dokument má v originále ,,trochu,, jiné pojmenování .
Další velký je v tom pojmenování dokumentu ...kde je text to zakončené slovy a jiné ! a já se ptám jaké jiné ? :)

Přílohy:
snapshot6.png
snapshot6.png [ 52.5 KiB | Zobrazeno 14790 krát ]

Autor:  PSM [ pon 07. srp 2017 1:42:39 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

Tak a Školské a výcvikové oddělení -Hlavního štábu je přepsané ... :)
Další na řadě je oddělení Branné výchovy taky je hubené na počet řádků.
A to je poslední tzv. dílčí ,,papírový,, inventář archivního fondu VHA pod názvem: Hlavní štáb 1919-1939 který v sobě sdružuje těch výše popsaných 7 oddělení .
Jak to o trochu víc zlepšit než jen mít tabulku ?
Plánuji je to propojit s ,,Žádanka pro badatele,, (odkaz zde : http://www.vuapraha.cz/dokumenty) to je objednávka co mají donést na stolek tj. a rovnou výsledky z databáze exportovat najednou sázet do políček formuláře podle vlastního přání. tzv po vyfiltrování dat z báze dat vám to překopíruje výsledek do jejich tiskopisu(Žádanky) podle omezení které lidem určily.

Výhled na další ,,přepis,, vidím v Prezidiálním odboru MNO ... pod 20 000 řádků to bude určitě :) Což je skoro zanedbatelný počet .... jen ty názvy dokumentu v tomhle fondu jsou sakra dlouhé a košaté... no nic nebude to lehké ani hned.

Autor:  PSM [ stř 16. srp 2017 23:07:59 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

...oddělení Branné výchovy Hlavního štábu je v tabulce kompletně.

Dost mně mrzí ,že není inventář fondu ,,ŘOP,, k tomu celku HŠ se totiž náramně hodí :)

Autor:  PSM [ stř 16. srp 2017 23:14:42 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

Dokonalost toho vyhledávání je daná tím jaké klíčové slova přiřadím k jednotlivým č.j. (tj. jejich počet , a jejich fundovanost ) Čím více klíčových slov tím bude hledání úspěšnější . Omezení to vlastně nemá žádné - klidně to snese 100000 slov ke každému čéječku :)
Podle názvu je ,,přidělení,, klíčových slov vyčerpané ..dál už jen použít z vlastního textu dokumentu, příloh :)

Autor:  PSM [ pát 18. srp 2017 12:36:22 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

Další archivní fond tentokrát je to ,,Prezidiální odbor MNO ,,.. (objem něco přes 16000 řádků)
--------------------------------------------------------------------------------------------
Prvních 1000 řádků je v tabulce přepsaných ..
PS.
Novinka: je tam změna v sytému jak byly dokumenty vedené... přibyl další sloupec v databázi - ,,číslo složky /číslo tj.pořadí ve složce,,
Jako již tradičně má to systém inventárních (archivních) čísel s odskokem do písmen příklad : Inv.č. 237 ; Inv.č. 237A;...

Autor:  PSM [ sob 02. zář 2017 12:35:39 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

Dalších + 2000 stran jsou v tabulce.

Autor:  PSM [ sob 02. zář 2017 19:57:43 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

Obsažnost hlavně u názvu dokumentu (a mnohdy i komentáře k němu) je značná ...na vzorku prvních dvou dílů to je přes 2,1mil. znaků včetně mezer....

Autor:  PSM [ stř 13. zář 2017 20:53:51 ]
Předmět příspěvku:  Re: VHA Inventáře v PDF přepsat do textu.. .

Hm zajímavý,,rekord,, : + 300 názvů dokumentů je ,,evidováno,, pod jedním inventárním číslem - hmm marně doufám v logiku ... Bordel byl je a bude je nesmrtelný :)

Stránka 3 z 3 Všechny časy jsou v UTC + 1 hodina [ Letní čas ]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/