-
Notifications
You must be signed in to change notification settings - Fork 0
Home
andy45 edited this page Jun 16, 2015
·
10 revisions
Tato stránka dokumentuje vývoj aplikace na převod dat slovníku Wordnet ze dvou různých formátů do jednotného XML formátu v rámci předmětu PB138: Moderní značkovací jazyky a jejich aplikace na Fakultě informatiky Masarykovy univerzity v Brně.
- Ondřej Bulla (učo: 422296) Závěrečná zpráva
- Jan Tomášek (učo: 422677) Závěrečná zpráva
Binární distribuce programu je ke stažení zde. Program se spouští souborem WordnetConvert.jar. Pro funkčnost arabské části programu je třeba mít ve složce i soubory arabicWordnet.xsd, awnToDebvisdic.xq, saxon9he.jar.
Aplikace bude po svém vytvoření pracovat následovně:
- načte od uživatele soubor se vstupními daty a formát vstupních dat (slovenská, litevská nebo arabská verze)
- vygeneruje výstupní data ve formátu DEBVisDic XML
Ondřej Bulla má na starosti arabskou část aplikace:
- nastudovat si formát ukládání dat v arabském Wordnetu
- vytvořit XSD schema arabského Wordnetu, pomocí kterého bude aplikace poznávat, zda jsou vstupní soubory, přijaté od uživatele validní
- nastudovat si formát DEBVisDic XML
- napsat XQuery Transformaci, pomocí které se budou převádět data z formátu vstupního souboru na formát DEBVisDic XML
Jan Tomášek má na starosti slovensko-litevskou část aplikace:
- nastudovat si formát ukládání dat ve slovenském a v litevském Wordnetu
- nastudovat si formát DEBVisDic XML
- naprogramovat parser, který z plaintextového vstupního dokumentu vytvoří XML dokument ve formátu DEBVisDic XML
Společně pak vývojáři navrhnou samotnou aplikaci, včetně grafického uživatelského rozhraní.