===== Usage ===== CLI --- To show averell help:: averell --help To list all available corpora:: averell list Visualization example of one of the available corpora: .. code-block:: text id name lang size docs words granularity license ---- ------------------- ------ ------ ------ ------- ------------- ----------- 1 Disco V2.1 es 22M 4088 381539 stanza CC-BY (disco2_1) line Download desired corpora into :file:`mycorpora` folder:: averell download 2 3 --corpora-folder my_corpora Example of poem in TEI format obtained from one of the corpora: .. code-block:: XML Spanish Metrical Patterns Bank: Golden Age Sonnets. Borja Navarro Colorado María Ribes Lafoz Noelia Sánchez López Borja Navarro Colorado Metrical patterns annotation Natural Language Processing Group. Department of Software and Computing Systems. University of Alicante (Spain) Sonetos de Garcilaso de La Vega. Biblioteca Virtual Miguel de Cervantes, edición de Ramón García González. stressed syllable unstressed syllable

All metrical patterns have been manually checked.

-XX- Con tal fuerza y vigor son concertados para mi perdición los duros vientos, que cortaron mis tiernos pensamientos luego que sobre mí fueron mostrados. El mal es que me quedan los cuidados en salvo de estos acontecimientos, que son duros, y tienen fundamentos
Generated example JSON file from input XML/TEI poem into :file:`my_corpora/{corpus}/averell/parser/{author_name}/{poem_name}.json` .. code-block:: JSON { "manually_checked": true, "poem_title": "-XX-", "author": "Garcilaso de La Vega", "stanzas": [ { "stanza_number": "1", "stanza_type": "cuarteto", "lines": [ { "line_number": "1", "line_text": "Con tal fuerza y vigor son concertados", "metrical_pattern": "-++--++--+-" }, { "line_number": "2", "line_text": "para mi perdición los duros vientos,", "metrical_pattern": "-----+-+-+-" }, { "line_number": "3", "line_text": "que cortaron mis tiernos pensamientos", "metrical_pattern": "--+--+---+-" }, { "line_number": "4", "line_text": "luego que sobre mí fueron mostrados.", "metrical_pattern": "+----++--+-" } ], "stanza_text": "Con tal fuerza y vigor son concertados\npara mi perdición los duros vientos,\nque cortaron mis tiernos pensamientos\nluego que sobre mí fueron mostrados." }, { "stanza_number": "2", "stanza_type": "terceto", "lines": [ { "line_number": "5", "line_text": "El mal es que me quedan los cuidados", "metrical_pattern": "-++--+---+-" }, { "line_number": "6", "line_text": "en salvo de estos acontecimientos,", "metrical_pattern": "---+-----+-" }, { "line_number": "7", "line_text": "que son duros, y tienen fundamentos", "metrical_pattern": "-++--+---+-" } ], "stanza_text": "El mal es que me quedan los cuidados\nen salvo de estos acontecimientos,\nque son duros, y tienen fundamentos" } ] } Now we can combine and join these corpora through "granularity" selection:: averell export 2 3 --granularity line --corpora-folder my_corpora --filename export_1 It produces an single JSON file with information about all the lines in those corpora. Example of **two** random lines in the file :file:`my_corpora/export_1.json`: .. code-block:: JSON { "line_number": "5", "line_text": "¿Has visto que en el mismo lugar donde", "metrical_pattern": "++---+--++-", "stanza_number": "2", "manually_checked": false, "poem_title": " - II - ", "author": "Mira de Amescua", "stanza_text": "¿Has visto que en el mismo lugar donde\nbordado estuvo el cristalino velo\nun bordado terliz de escarcha y hielo\nhace que el campo de verdor se monde?", "stanza_type": "cuarteto" } { "line_number": "10", "line_text": "el que a lo cierto no a lo incierto mira,", "metrical_pattern": "---+-+-+-+-", "stanza_number": "3", "manually_checked": false, "poem_title": "- VIII - Considerando un sepulcro y los que están en él ", "author": "Lope de Zarate", "stanza_text": "De aquí si que consigue el ser dichoso\nel que a lo cierto no a lo incierto mira,\npues le adorna lo eterno fastuoso;", "stanza_type": "terceto" } In a project ------------ To use averell in a project:: import averell