Skip to content
andy45 edited this page Jun 16, 2015 · 10 revisions

Aplikace na převod dat slovníku Wordnet ze dvou různých formátů do jednotného XML formátu

Tato stránka dokumentuje vývoj aplikace na převod dat slovníku Wordnet ze dvou různých formátů do jednotného XML formátu v rámci předmětu PB138: Moderní značkovací jazyky a jejich aplikace na Fakultě informatiky Masarykovy univerzity v Brně.

Vývojáři

Binární distribuce

Binární distribuce programu je ke stažení zde. Program se spouští souborem WordnetConvert.jar. Pro funkčnost arabské části programu je třeba mít ve složce i soubory arabicWordnet.xsd, awnToDebvisdic.xq, saxon9he.jar.

Popis aplikace

Aplikace bude po svém vytvoření pracovat následovně:

  1. načte od uživatele soubor se vstupními daty a formát vstupních dat (slovenská, litevská nebo arabská verze)
  2. vygeneruje výstupní data ve formátu DEBVisDic XML

Podrobný popis zde

Rozdělení práce

Ondřej Bulla má na starosti arabskou část aplikace:

  • nastudovat si formát ukládání dat v arabském Wordnetu
  • vytvořit XSD schema arabského Wordnetu, pomocí kterého bude aplikace poznávat, zda jsou vstupní soubory, přijaté od uživatele validní
  • nastudovat si formát DEBVisDic XML
  • napsat XQuery Transformaci, pomocí které se budou převádět data z formátu vstupního souboru na formát DEBVisDic XML

Jan Tomášek má na starosti slovensko-litevskou část aplikace:

  • nastudovat si formát ukládání dat ve slovenském a v litevském Wordnetu
  • nastudovat si formát DEBVisDic XML
  • naprogramovat parser, který z plaintextového vstupního dokumentu vytvoří XML dokument ve formátu DEBVisDic XML

Společně pak vývojáři navrhnou samotnou aplikaci, včetně grafického uživatelského rozhraní.